-
大數(shù)據(jù)扒一扒蔡徐坤的真假流量粉:動(dòng)輒轉(zhuǎn)發(fā)百萬(wàn)有多少是套路?
關(guān)鍵字: 蔡徐坤流量蔡徐坤本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號(hào)“Alfred數(shù)據(jù)室”(Alfred_Lab), 作者AlfredWu。
前段時(shí)間央視新聞公開(kāi)披露流量明星數(shù)據(jù)造假。作為一名數(shù)據(jù)猿,我們秉著好奇心點(diǎn)開(kāi)了NBA新春賀歲形象大使蔡徐坤的微博,發(fā)現(xiàn)他的微博轉(zhuǎn)發(fā)量除了最新一條之外,其它的基本每條都是轉(zhuǎn)發(fā)100萬(wàn)+。
在我們的印象中,轉(zhuǎn)發(fā)100萬(wàn)+可是某些明星官宣結(jié)婚、或者某些明星吸毒出軌被爆等能讓微博服務(wù)器奔潰的流量呀。蔡徐坤真的那么火嗎?他的100萬(wàn)+轉(zhuǎn)發(fā)里到底是否存在假流量?假流量所占比重有多少呢?
為了解答這個(gè)問(wèn)題,我們通過(guò)微博移動(dòng)端隨機(jī)抓取了蔡徐坤的一條微博《再見(jiàn),“任性的”千千…》的10萬(wàn)條轉(zhuǎn)發(fā)數(shù)據(jù)(時(shí)間節(jié)點(diǎn)2019年3月11日10時(shí))。這條講訴蔡徐坤關(guān)愛(ài)小動(dòng)物的短視頻微博,于2019年3月9日01:23發(fā)布,到2019年3月10日18:00的時(shí)候已經(jīng)被轉(zhuǎn)發(fā)100萬(wàn)+。
數(shù)據(jù)的維度包括轉(zhuǎn)發(fā)者的相關(guān)信息(昵稱、性別、關(guān)注者數(shù)量和被關(guān)注者數(shù)量等)以及轉(zhuǎn)發(fā)時(shí)的評(píng)論等。
一、蔡徐坤的微博轉(zhuǎn)發(fā)是否存在假流量?
解答這個(gè)問(wèn)題之前,我們其實(shí)對(duì)于蔡徐坤的粉絲性別比例更加感興趣。按理來(lái)說(shuō)應(yīng)該他的女粉絲所占比例應(yīng)該更大,但是我們統(tǒng)計(jì)了102313條轉(zhuǎn)發(fā)數(shù)據(jù)中,有93618條是男粉絲轉(zhuǎn)發(fā)的,只有8695條是女粉絲轉(zhuǎn)發(fā)的。
這不對(duì)呀,難道更多的男生喜歡蔡徐坤嗎?而且這比例也太懸殊了一點(diǎn)吧?于是我們隨機(jī)抽取了男生轉(zhuǎn)發(fā)的數(shù)據(jù),發(fā)現(xiàn)這些轉(zhuǎn)發(fā)的男粉絲基本上都是關(guān)注0,粉絲1的用戶。
我們合理地推測(cè):這些流量就是所謂的假流量。
那假流量所占的比例有多少呢?在這隨機(jī)抓取的10萬(wàn)條轉(zhuǎn)發(fā)數(shù)據(jù)中,有多少是假的流量呢?
二、真假流量所占的比例各有多少?
通過(guò)一番探索分析,我們把轉(zhuǎn)發(fā)數(shù)據(jù)中轉(zhuǎn)發(fā)者的關(guān)注或者粉絲數(shù)少于等于5、沒(méi)有簡(jiǎn)介、轉(zhuǎn)發(fā)之后被點(diǎn)贊數(shù)評(píng)論數(shù)再轉(zhuǎn)發(fā)數(shù)都為0、微博會(huì)員等級(jí)為0級(jí)的數(shù)據(jù),以及轉(zhuǎn)發(fā)者的關(guān)注或者粉絲數(shù)大于等于5但昵稱長(zhǎng)“用戶XXXXXXXX”這樣的數(shù)據(jù)抽取了出來(lái)。
這部分?jǐn)?shù)據(jù),便是我們所說(shuō)的假流量。
可見(jiàn),102313條轉(zhuǎn)發(fā)數(shù)據(jù)中,有95397條是由假粉絲轉(zhuǎn)發(fā)的,占了總轉(zhuǎn)發(fā)的93.24%,只有6916條是由真粉絲轉(zhuǎn)發(fā)的,占6.76%。原來(lái)假流量占的比重那么高?。?
那么6919條真粉絲轉(zhuǎn)發(fā)的數(shù)據(jù)中,除去重復(fù)轉(zhuǎn)發(fā)刷榜的數(shù)量,里面一共有多少個(gè)真粉絲在轉(zhuǎn)發(fā)呢?我們把這部分?jǐn)?shù)據(jù)按照粉絲微博ID進(jìn)行去重。發(fā)現(xiàn)這里面只有3926個(gè)真粉絲在轉(zhuǎn)發(fā),也就是說(shuō),真實(shí)轉(zhuǎn)發(fā)的粉絲數(shù)量,占總轉(zhuǎn)發(fā)量的3.84%。
按照這個(gè)比例,可以推算出100萬(wàn)的轉(zhuǎn)發(fā)中,真實(shí)轉(zhuǎn)發(fā)的粉絲數(shù)為3.84萬(wàn),說(shuō)明蔡徐坤的粉絲群和影響力還是很大的,但遠(yuǎn)沒(méi)有微博顯示的全是100萬(wàn)+轉(zhuǎn)發(fā)量那么大。
- 原標(biāo)題:大數(shù)據(jù)扒一扒蔡徐坤的真假流量粉:動(dòng)輒轉(zhuǎn)發(fā)百萬(wàn)有多少是套路?
- 責(zé)任編輯:陸雨聆
- 最后更新: 2019-04-04 15:55:54
-
蔡英文母校標(biāo)臺(tái)灣為中國(guó)一部分,臺(tái)當(dāng)局崩潰
2019-04-04 15:52 臺(tái)灣 -
頻繁跳槽影響個(gè)人信用?浙江人社廳:只針對(duì)惡意跳槽
2019-04-04 15:19 -
頻繁跳槽影響個(gè)人信用?浙江人社廳澄清
2019-04-04 15:04 最難就業(yè)季 -
持續(xù)真香!是什么魔力讓新版《倚天屠龍記》持續(xù)漲分?
2019-04-04 14:15 中國(guó)電視劇 -
中學(xué)生因未“告密”被罰后自殺?鄭州教育局回應(yīng)
2019-04-04 13:55 -
又有用火災(zāi)烈士打廣告的?!
2019-04-04 13:50 捍衛(wèi)英雄 -
“太赫茲能量鞋”治腦梗?專家:可能是騙局
2019-04-04 13:46 -
致敬英烈,唱響吾輩當(dāng)自強(qiáng)的時(shí)代最強(qiáng)音
2019-04-04 13:32 -
平均薪酬1.1萬(wàn),打游戲也成“正經(jīng)職業(yè)“了
2019-04-04 13:10 -
“舍命產(chǎn)子”重病妻子離世 丈夫回應(yīng)爭(zhēng)議:醫(yī)生所說(shuō)并不屬實(shí)
2019-04-04 13:10 -
李志否認(rèn)因行為不端被取消巡演 可經(jīng)紀(jì)人好像不是這個(gè)意思...
2019-04-04 12:11 明星那點(diǎn)事兒 -
被綁留學(xué)生是鹽城紀(jì)委書(shū)記“闊綽兒子”?假的!
2019-04-04 11:50 網(wǎng)絡(luò)謠言 -
00后的社交黑話 也太讓人上頭了吧…
2019-04-04 11:12 趣讀 -
英雄永在!30名犧牲人員被批準(zhǔn)為烈士
2019-04-04 11:05 捍衛(wèi)英雄 -
黃牛代買(mǎi)喜茶月入過(guò)萬(wàn):一天三四十杯不愁賣(mài)不出去
2019-04-04 11:04 -
李志因身體抱恙取消演唱會(huì) 官方:行為不端被叫停
2019-04-04 10:57 明星那點(diǎn)事兒 -
在德國(guó)學(xué)術(shù)成果被掠奪,當(dāng)事人:回國(guó)后進(jìn)展更順利
2019-04-04 10:51 -
曾偉雄任國(guó)家公職,香港各界盼有更多港人參與
2019-04-04 10:36 香港 -
這個(gè)iG冠軍皮膚,王思聰很眼熟
2019-04-04 10:20 趣讀 -
習(xí)近平這些話,致敬民族最閃亮的坐標(biāo)
2019-04-04 10:18 新時(shí)代新氣象新作為
相關(guān)推薦 -
?;鸬谝灰梗“突ハ嘀肛?zé) 評(píng)論 102王毅分別同印巴雙方通話 評(píng)論 205印巴?;?,特朗普邀功 評(píng)論 595巴防長(zhǎng):核選項(xiàng)不在考慮中,但是… 評(píng)論 97印度稱“不想升級(jí)”,巴方想“就此打住” 評(píng)論 432最新聞 Hot
-
伊朗官員:美國(guó)不真誠(chéng)
-
?;鸬谝灰?,印巴互相指責(zé)
-
為什么選出美國(guó)籍教皇?梵蒂岡消息人士:還不是因?yàn)樘乩势?/a>
-
普京提議:15日,俄烏直接談
-
王毅分別同印巴雙方通話
-
印度稱“不想升級(jí)”,巴方想“就此打住”
-
英法德波領(lǐng)導(dǎo)人訪問(wèn)基輔,將與澤連斯基共同討論?;饐?wèn)題
-
印軍否認(rèn)S-400防空系統(tǒng)被摧毀
-
印度前高官:勸巴基斯坦,中國(guó)的話好使
-
空中爆炸!巴軍通報(bào)7日空戰(zhàn)細(xì)節(jié),含擊落“陣風(fēng)”錄音
-
要松口了?印官員稱將“適時(shí)”公開(kāi)
-
印度32座機(jī)場(chǎng)暫停對(duì)所有民用航班運(yùn)營(yíng)
-
英官員承認(rèn):美英貿(mào)易協(xié)議這條款,沖中國(guó)來(lái)的
-
巴外長(zhǎng):印度讓巴基斯坦別無(wú)選擇
-
巴基斯坦稱使用“梟龍”戰(zhàn)機(jī)擊毀印度S-400防空系統(tǒng)
-
搞錢(qián)色交易、貪欲膨脹,深圳市政協(xié)原副主席王幼鵬被“雙開(kāi)”
快訊- 中美經(jīng)貿(mào)高層會(huì)談11日將繼續(xù)進(jìn)行
- “70后”董事長(zhǎng),被立案
- “卡皮巴拉”出逃40天,動(dòng)物園發(fā)懸賞公告
- 梁偉任上被查,兩天前還公開(kāi)露面
- 全球首發(fā)TPS霧化無(wú)創(chuàng)透皮技術(shù),MOYAL嵐至亮相美沃斯大會(huì)
- 女演員陷“辱華”爭(zhēng)議,待播劇《赴山?!坊蚴懿?/a>
- 91歲的日本明仁上皇被診斷為無(wú)癥狀心肌缺血
- 習(xí)近平將出席中國(guó)-拉美和加勒比國(guó)家共同體論壇第四屆部長(zhǎng)級(jí)會(huì)議開(kāi)幕式
-