2006年3月3日 星期五

瀏覽率排名的漏洞

現在 SinaBlog 用了 "網誌排行是根據該網誌最近三星期的文章總瀏覽率統計而成". 我想在這裡分享這方法的漏洞.


首先聲明, 我不是想大家爭論排行榜, 或利用以下提出的漏洞增加自已的排名, 在我 舊文新貼後感 和 入了網誌排名第六 一篇, 已說了排行高不是甚麼了. 我說出這漏洞, 只是希望大家知道, 也希望大家自律, 不要利用.

文章總瀏覽數, 對系統來說, 是文章的下載次數, 例如你看這文章, 然後按IE [重新整理] 钮十次, 這文章的瀏覽數就會多十次了.

你或許覺得要自已按十次, 按到手軟, 最多只可以增加幾百點. 你忘記了出面有很多系統可以幫你在一分鐘內, 點擊幾千次. 不信嗎? 你可以下載我編寫的 留言管理系統 (BlogReply), 把自己文章加入, 登入你的管理頁面, 看總瀏覽數, 然後按 [更新] 鈕, "每篇文章" 就會多一個瀏覽數了 (試一次好了, 不要亂利用呀). 因為 BlogReply 真的要下載整篇文章, 才可以獲得文章的留言總數 (希望Sina可以提供一個功能給我BlogReply, 不需要下載整篇文章, 都可以獲得文章的留言總數).

我為何要寫這類的系統來幫人增加瀏覽? 我寫的目的, 是要方便大家管理留言, 正如做刀的人,  不想人用它來殺人. 另外, 沒有我這系統, 出面還有很多這類的系統呢.

那麼, 有沒有更好和公平的方法排名呢?

亞占在 "客觀排名vs主觀排名" 所提出的 "讓瀏覽者評分" 方法, 其實 sina 在留言時已有這功能, 但如果同一個人留言十次, 每次給十分, 那樣如何處理?

你或許會建議每人只可以評分一次, 但如果不是 sina 的瀏覽者, 就不可以評分了. 另外, 要做這 "每人只可以評分每篇文章一次" 功能, sinablog 資料庫和負荷就會大大增加, 到時就會 hang hang 地了.

所謂道高一尺魔高一丈, 最好的方法, 是大家自律吧!

9 則留言:

  1. I think the system use read rate instead of hit rate, i.e. how many --> 15 Reads.Any the read count would not be changed by simply doing refresh. Thus, using program to generate hit rate would not have any effect on actual reads.

    回覆刪除
  2. How to distinguish Hits or Reads? BlogReply actually read the whole article once.

    回覆刪除
  3. In general case, not use your tailored reply program, i.e., press F5 or use other refresh program (F5 repeater) will not change the count on reads, that is hit rate. Just like if I read this passage, and not reply but only press F5, then the count will not change.If you Blogreply will affect the count while no actual reply is made, then I guess it should be considered as logical bug.

    回覆刪除
  4. 可否考慮這中庸方案?
    當閱讀文章後,有一欄給輸入認証數字(旁邊印有該數字),像現在留言驗證一樣。輸入認證數字後可為該文加一分。排名就是看這個分。
    詳細分析我在我的博講。

    回覆刪除
  5. 我相信是一HIT一READ的~
    之前在大陸有一個月時間看不到圖!
    我要不停更新十多次才可以看到圖。
    但READ數是沒有增加的,但當有新留這後,READ數就增加了,之後我就好奇試下按更新十次再自己留這給自己,便增加了10READ,再刪那留這。
    但也不算什麼漏洞,因為READ數應該比COMMENT數來得低權重,再者1000READ但10個留言都不好看啦~

    回覆刪除
  6. 黃龍 : ,再者1000READ但10個留言都不好看啦~X2

    回覆刪除
  7. 這樣又要一人只可以評分一次, 要做這個 "Relation", 資料庫和系統負擔又增大了.

    回覆刪除
  8. 我喜歡看每編文外界不同的反應, 所以有些文很低瀏覽率我都會照寫不理.如果偽造一些read數來, 我覺得這是自欺欺人,其實是對自己沒有信心的表現. 我反而有時隨意去一些低瀏覽率的網站, 如果我見該blogger需然面對低瀏覽率依然奮力地寫下去, 我是會對他另眼相看的.
    因為他已建立自信自強的性格.

    回覆刪除
  9. 从技术上说,想要完全区分hit的read并不是完全不可能,但对系统复杂度要求非常高,需要记录下很多相关信息(IP,最后请求时间 etc.),所以对一般的网站来说都不可行,而且也是没有必要的。

    回覆刪除