2009년 01월 05일
한RSS 페이퍼 노출알고리즘에 대한 해명
최근 한RSS 페이퍼 노출에 대한 불만이 많이 있으신 듯 하여 운영자 중 1인으로서 간단하게라도 해명을 드려야할 것 같아 적어봅니다. 이 글을 통하여 부디 너그러운 양해를... m(_,_)m

1) 페이퍼 노출은 정말로 기계알고리즘을 이용하나요?
예. 분명히 그렇습니다. 처음 페이퍼를 설계할 때부터 "블로고스피어의 구글뉴스" 같은 것을 만드려고 한 것입니다.
사실 회사 내부적으로도 페이퍼를 편집할 인력이라는 게 존재하지 않기 때문에 거의 기계에 의존할 수 밖에 없습니다.
물론 이따금씩 1~2명 정도가 손으로 보정작업을 해주긴 합니다만, 주로 낚시성/신변잡기성 글을 걸러준다던가 썸네일을 조정한다던가 등의 작업입니다.
만약 페이퍼 인기글을 사람손으로만 관리할 생각이었다면, 애초부터 기능 자체를 오픈하지 않았을 것입니다.

2) 노출알고리즘의 기준은 무엇입니까?
현재로선 구독자 100명 이상의 피드가 그 노출대상입니다.
사람이 기계를 학습시켜서, 그 학습한 기계가 자기 지능에 기반하여 포스트 노출여부를 정합니다.
스팸필터에도 자주 사용되는 Bayesian Filtering 등 Machine Learning에 관한 기법들이 사용되지만, 사람이 편집하는 수준의 정교함을 얻기까지는 역시 무리인 것 같습니다.
향후 기준이 조정될 수도 있고, 기계적 알고리즘이 어뷰징에 악용될 우려도 있으므로 세세한 부분까지는 설명이 어려움을 양해부탁드립니다.

3) 왜 특정 블로그의 글이 편중되어 올라오나요? 낚시성이나 수준미달의 글이 왜 이렇게 많이 나오나요?
특정블로그를 편애한다거나 하는 일은 전혀 없습니다. 모종의 커넥션도 있을 수가 없죠.
스폰서포스트가 노출되는 경우가 있는데, 해당 포스트 옆에는 [SP] 같은 표시를 해줍니다.
오히려 사람이 일일히 선정하고 편집해서 올린다면 이런 문제가 없겠지만, 결국 돈과 기술력과 인력의 부족으로부터 비롯된 문제인 것 같습니다.
스팸블로그는 아니지만 상대적으로 포스팅을 많이 하는 블로거일 수도 있으며, 낚시성이기 때문에 오히려 사람들이 많이 읽어서일수도 있습니다. 한RSS 페이퍼는 로직이 2가지로 나뉘어져있습니다. 하나는 스팸성/낚시성/신변잡기성 등의 글을 걸러내는 필터링로직이고, 다른 하나는 그런 필터링 과정을 통과한 글들 중에서 인기글을 선정해내는 로직입니다. 다양한 주제로 다작을 하는 블로거일 경우, 아무래도 필터링로직에서 통과될 확률이 상대적으로 높을 수 밖에 없겠고요, 인기글 선정에는 조회수나 구독자의 패턴 등이 이용되고있다고 보시면 되겠네요. (물론 이런 로직구조에 대해선 향후 당연히 변경가능성은 있습니다.)

4) 페이퍼에 왜 제 글은 노출되지 않는건가요?
사실 처음 페이퍼를 설계할 시점에는 오히려 "자기 글을 노출제외 시켜줄" 것을 많이 요청하실 거라고 판단했습니다.
그런데 그 예상은 여지없이 빗나가더군요. 이제까지 한분도 노출제외를 요청하신 적이 없을 뿐더러 오히려 노출이 안된다는 사실에 많은 불만을 제기하셨죠.
분명 보완책이 필요한 부분이긴 합니다만, 좀더 고차원적인 재설계를 수행하기엔 내부리소스가 워낙 한정되어있다보니... 여기에 대해선 뭐라 드릴 말씀이 없네요.

5) 특정 블로그만 페이퍼에서 제외시킬 수 있는 기능은 왜 아직도 구현이 안되고 있나요?
사실 이 부분은 구현 직전까지 가기도 했지만, 결국 시스템 부하 등의 문제로 진행이 보류되었습니다.
페이퍼 옆의 화살표를 눌러서 페이퍼 자체를 닫아놓으실 수 있기 때문에, 우선은 그 방법을 이용하셔야할 것 같습니다.
필터링 기능만을 유료화시키는 방안도 고민하고 있으며, 더 큰 그림으로는 홈 자체를 완전히 커스터마이징할 수 있게하는 방안에 대해서도 연구 중에 있습니다.
다만 이 또한 내부리소스 부족으로 인해 단기간에 실행되기에는 아무래도 어려움이... ;;

6) 이런 문제많은 페이퍼를 계속 유지하는 이유가 무엇입니까?
사실 페이퍼를 처음 설계할 때만 해도 페이퍼에 이렇게 많은 관심을 주실지 몰랐습니다. 단지 기술적인 실험들의 연장이었을 뿐이죠.
그런데 아직 부족한 페이퍼에 많은 분들이 관심을 가져주셨고, 막상 품질을 높이려다보니 딜레마성 문제들로 가득한데다 리소스의 한계도 있다보니 많이 어렵네요.
당분간은 페이퍼 옆의 화살표를 눌러서 닫아놓고 안보시는 방법 이외에는 뾰족히 추천드릴 방법이 없을 것 같습니다.
사실 유일한 해결책은 한RSS가 "돈"을 충분히 많이 벌어서, 마음놓고 이런 부분에 투자할 수 있는 상황이 되는 것이겠습니다만...


이상 해명이 제대로 됬을지는 모르겠습니다만, 어쨌든 많은 질책에도 불구하고 매번 앵무새 같은 답변만을 할 수 밖에 없는 상황을 죄송스럽게 생각합니다.
한RSS도 위키피디아처럼 기부받아 운영해야하는 게 아니냐는 누군가의 의견도 있긴 했습니다만, 어쨌든 현재로선 얼른 돈버는 서비스가 되는게 모두를 위한 최선이 아닌가라는 뜬금없는 결론을... ;;
by 성렬 | 2009/01/05 11:55 | 한RSS | 트랙백(3) | 덧글(15)
트랙백 주소 : http://srlog.egloos.com/tb/4802674
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Tracked from LieBe's Graf.. at 2009/01/05 12:36

제목 : 도무지 이해가 안가는 HanRSS의 정책
저는 RSS 리더기로 HanRSS를 이용하고 있습니다. 기타 좋은 RSS 리더기가 많겠지만 우선 플랫폼 프리의 장점에다가 많은 사람들이 이용하는 범용성 (사실 이건 장점이라 말하긴 뭐한....), 게다가 제 온라인 스타일에 기인한 바가 가장 크다고 말할수 있겠네요. - 그래서 구글 리더기를 잘 안씁니다. 검색하는데는 구글 없이는 못사는 지경이지만 희안하게 구글의 기타 서비스는 손이 잘 안가더군요. 어쨌건 이런저런 연유로 HanRSS를 쓰고 그에......more

Tracked from 레이니돌 수필로그 at 2009/01/05 19:14

제목 : 인기글 알고리즘에 대한, 어처구니 없는 한RSS의 해명
"하루에도 서너 번씩 올라오던 특정 블로그들의 글이 오늘은 이상하게도 완전히 그 자취를 감추었다" 사용자들의 서비스에 대한 불신은 이렇게 싹트는 것이 아닐까. 어제 올블로그에서 아래와 같은 글을 읽었다. 도무지 이해가 안가는 HanRSS의 정책 - LieBe 간단히 말하자면 한RSS의 인기글 노출과 그 빈도에 대한 한RSS 측의 정책을 지적한 글이었는데, 오늘은 한RSS의 운영자라는 분이 일종의 해명으로 아래와 같은 글을 자신의 블로그에 올려두......more

Tracked from e0en at 2009/08/21 15:38

제목 : hanrss 불만 2.
hanrss 불만 예전에도 hanrss "페이퍼" 코너에 올라오는 블로그 포스팅들의 다양성이 부족하다는 글을 썼었고, 무려 성렬님께서 직접 리플을 달아 주셔서 개선이 될 거라고 기대했었다. 정작 나는 페이퍼 코너를 한동안 닫아 두고 안 썼지만. 근데 최근에 다시 페이퍼 코너를 열어두고 종종 링크된 포스팅을 읽곤 하는데, 발전된 점이 전혀 보이지 않는다. 사실 가장 불만인 것은 "사진은 권력이다" 블로그의 글이 지나치게 자주 보인다는 점이다. 얼......more

Commented by LieBe at 2009/01/05 12:36
우선 글을 읽으면서 작은 벤처(?) 기업의 애로가 느껴지는듯 하여 조금 마음이 울적해지네요...
저는 일반적인 서비스론과 어떤 현상에 대한 문제점의 문제제기의 시각에서 비판글을 적은 것이지만 세상사가 다 그렇듯이 모두에게 천편일률적으로 다 적용하고 잣대를 들이밀수는 없는 노릇이기도 하고요..
그런 감상의 얘기는 잠시 접어두고....

HanRSS를 사용하는 유저층이 괸장히 넓다는것은 아실듯 합니다.
블로그스피어의 대부분의 블로그를 방문해도 HanRSS 피드 버튼이 없는곳을 찿기가 더 힘들정도니까요. 물론 그것이 리더기를 사용하는 보증은 안되지만 일단 사용자층도 넓고 그 사용자에게 제공되는 서비스의 시각적 UI 에서 인기글 노출이 굉장히 큰 비중을 차지한다는 것도 어느정도 인지하셨으리라 여깁니다.
(물론 위에 해명하신 글에서는 페이퍼에 대한 기대치가 처음엔 작았다고 말씀하셨지만....)

그런 많은 사람들이 이용하는 서비스의 큰 비중을 차지하는 공간에 대한 서비스는 아무리 그 서비스가 메인 서비스가 아니더라도 큰 비중의 심사숙고가 있어야 하지 않겠느냐는 것이 제 글의 요지이자 시각입니다.
일단 제가 많은 부분 놀란 것이 HanRSS는 제가 지금껏 보아온 서비스 중 유저와의 피드백이 상당히 훌륭하고 좋은 서비스로 기억하는데 이 부분에 대해서는 상당기간 불만 점이 토로되어져도 어떤 해결책을 내놓지 못햇다는 것입니다.
물론 인적, 물적인 환경이 뒷받침되지 못한 부분에 대해서는 이해가 많이 가지만 인기글-페이퍼의 문제는 상당부분 무시할수 없는 비중의 서비스이니 문제점이 확연하고 많은 사람들에게 불만을 야기할수 있다면 재고해야 할 부분이 아닐까 하네요.
- 하나의 극단적인 예를 들면 서비스의 일시 중단 후 개선책을 내놨어야 한다고 여겨집니다.

아무튼 좋은 말씀 잘 들었습니다.
허나 일견 이해가 가는 부분도 상당히 많았지만 결국 지난 1년 넘게 제기되어온 문제점에 대한 기존 입장의 표방이라는 비평에서 자유로울수도 없을 거란 생각도 듭니다.
사실 제 생각에서는 HanRSS는 거의 나무랄데 없는 서비스인데 이런 부가 서비스로 인해 굳이 나쁜 인상을 남길 이유도 필요도 없지 않나 싶습니다.

수고하시고 더 나은 서비스를 부탁 드립니다...
Commented by 고감자 at 2009/01/05 12:47
앞으로는 구독자 수가 적은 분들도 위로 올라갈 수 있는 기회를 주세요.

좋은 서비스 감사합니다.


Commented by fancyydk at 2009/01/05 16:02
좋은 서비스 정말 감사합니다 ^^

구독자 수가 적은 블로그 중에도 정말 양질의 포스팅을 하시는 블로거님들을 몇분 알고 있습니다.
그런 분들을 위해 따로 한 칸을 마련해 주신다면 정말 좋지 않을까 하는 생각이 드네요 ㅎㅎ.

한RSS 정말 깔끔한 인터페이스도 맘에 들고 좋아하는 웹 서비스입니다. 앞으로 많은 발전 기대하겠습니다 ^^
Commented by k at 2009/01/05 16:15
한RSS 페이퍼 노출에는 저도 역시 불만이 있지만 그래도 한RSS는 최고의 서비스중 하나라고 생각합니다. 화이팅!
Commented by 마티오 at 2009/01/05 17:09
이렇게 설명해주셔서 감사합니다.
이해가 쉽게 되지 않는것이 있다면 "스팸블로그는 아니지만 상대적으로 포스팅을 많이 하는 블로거일 수도 있으며" 이부분인데, 블로그에 글을 자주 올릴 수록 페이퍼에 노출될 확률이 높다는것인가요?

좋은 서비스 감사드립니다 :)
Commented by 마음으로 찍는 사진 at 2009/01/05 17:25
화이팅 입니다. :)

성렬님 새해 복 많이 받으세요~
Commented by mpeay at 2009/01/05 18:02
가장 많이 사용하고 있고, 현존 최고라고 생각하는 서비스는 한RSS 입니다.
개인적으로 그렇다는 것이지요. ^^

Commented by 아크몬드 at 2009/01/05 18:08
항상 수고 많으십니다..
Commented by 레이니돌 at 2009/01/05 18:28
상대적으로 포스팅을 많이 하는 블로거일 수도 있어 자주 노출이 될 수도 있다, 는 식의 해명은 도무지 납득이 되질 않네요. 사실이 아니다, 그런 일은 있을 수 없다, 특유의 알고리즘이 있다, 는 식의 해명은 더욱 말이 되지 않는 것 아닌가요? 비꼬아서 생각을 해보면 "사실도 아니고, 그런 일도 있을 수 없고, 더군다나 기계적 알고리즘까지 있는데 너네들이 괜히 넘겨짚는거다"라는 식도 가능하니 말입니다.

그동안 인기글에 대한 한RSS 내부(운영게시판 같은)에서의 목소리를 꾸준히 있어왔던 것으로 알고 있습니다만, 지금까지 아무런 외부 입장 발표도 없다가 이렇게 올블로그에 글이 올라와서 화제가 되니 내놓는 식의 해명은, 솔직히 '수고하세요'라는 말밖엔 나오지가 않네요.
Commented by 쿨짹 at 2009/01/06 05:54
저는 한rss구독자 수가 한 300 가까이 되는 지금에도 한번도 페이퍼에 올라온 걸 못봤어요. ㅠㅜ
Commented by myditto at 2009/01/06 09:04
HanRss 화이팅!!!!!!!!!!!!!!!!!!!!! 최고에요 !!!!!!!!!!!!!!
HanRss 화이팅!!!!!!!!!!!!!!!!!!!!! 최고에요 !!!!!!!!!!!!!!
Commented by webJOY at 2009/01/06 10:16
항상 그놈의 인기글에 토가 많이 달리는 군. 추천글로 바꾸심이. ㅎㅎ
Commented by lunamoth at 2009/01/06 20:34
LieBe님 글에서 말씀드리긴 했습니다만, 발행빈도를 좀더 고려해서 모든 블로그들이 편중없이 노출이 되도록 하는 방향으로 개선이 되면 좋을 것 같습니다.^^;
Commented by 성렬 at 2009/01/15 10:38
> 마티오, 레이니돌, lunamoth : 한RSS 페이퍼는 로직이 2가지로 나뉘어져있습니다. 하나는 스팸성/낚시성/신변잡기성 등의 글을 걸러내는 필터링로직이고, 다른 하나는 그런 필터링 과정을 통과한 글들 중에서 인기글을 선정해내는 로직입니다. 다양한 주제로 다작을 하는 블로거일 경우, 아무래도 필터링로직에서 통과될 확률이 상대적으로 높을 수 밖에 없겠고요, 인기글 선정에는 조회수나 구독자의 패턴 등이 이용되고있다고 보시면 되겠네요. (물론 이런 로직구조에 대해선 향후 당연히 변경가능성은 있습니다.) 2가지가 섞이면서 모호해졌던 위의 표현 죄송합니다.
Commented at 2009/01/28 18:59
비공개 덧글입니다.

:         :

:

비공개 덧글



<< 이전 페이지 | 다음 페이지 >>