1、垂直論壇的深度挖掘
搜索論壇的方式,和在國外搜索行業的方式一樣。百度搜索“興趣+論壇”,就可以得出非常多的結果。現在比較大的領域,一般都有相應的論壇。
TIPS:可以通過觀察相應的論壇的活躍度,來確定這個興趣的領域是否足夠大。
比如搜“微電影論壇”。我們可以發現,相應的論壇的活躍度都挺低。這代表對這個興趣比較感興趣的用戶,不活躍在百度這個平臺了。
不活躍在百度,意味著這個項目沒有價值嗎?并非如此。不活躍代表這個項目的價值在別的平臺轉移。再比如,冷門SEM的熱門標的項目“疾病類”的論壇,我們就可以很容易的挖掘到一些細枝末節的細節。比如哮喘。
我們就可以在帖子中發現病人的問題,以及他們是否需要一些輔助設備。由于疾病類的比較敏感,建議通過特殊的角度進行切入。當搜尋了這些問題或者項目的時候,記得反向進入百度的競價后臺查詢,就可以獲得準確的數據。
2、信息源的模塊化建設
1)以百度貼吧為例的自動化模塊化設計
既然要做信息源的收集,那么節約時間就顯得非常必要。首先,我們要確定自己要做的是大概的什么方向。譬如,自己如果之前有做過文玩,或者這方面的興趣,那么就可以圍繞這個方向進行收集。在這里呢,我們可以在表格里做一下數據上的規劃。通過之前文章的方法,我們去百度貼吧做第一層的模塊化數據篩選。
排除:搜索量極低的,不符合大小原則的。然后,我們就可以大概做出這樣的圖表。
然后,就可以將 相關的搜索詞(子興趣),作二次的流量分類。
分類以后,我們就可以開始做數據的篩查了。但是現在問題來了,如此龐大的子興趣,我們如何有效的提高效率呢?答案是采集。
現在的第三方軟件已經非常方便,比如:八爪魚等。八爪魚目前的整體功能基本上已經做到了“可視化”。簡單操作,即可獲得詳實的數據。那么,如何定義采集的規則呢?
1)頁面里面有什么?
在知道我么想要什么之前,我們先要理解,網頁是什么。網頁說一個通俗的比喻,就是一張疊一張的紙。比如,我們打開“核桃”吧,我們在第一張紙看到的內容是以下。分類、標題,最后回復時間。
2)我們想要什么?
根據之前的文章,我們知道,我們要的是:興趣的活躍度、興趣內的需求、興趣內的產品的價格
3)我們怎么做?
判斷我們想要的數據,在不在當前頁面。如,我們想要了解的活躍度,就可以通過第一層頁面帖子最右側的最后回帖時間進行部分解決。
2、我們想要的數據,需要多少種指標?
譬如,我們想要知道的是“核桃”這個子興趣的活躍度。那么,主吧頁面的最后回復帖子的時間是不足以佐證的。我們需要打開第二層頁面,觀察更多所需的指標。如是否需要統計第二層頁面的回復數,參與的ID。
如貼中的“阿墨文玩”就是典型的一個ID。
注:“核桃”吧是一個商業化非常嚴重的貼吧。通俗的說,嗯,大部分的內容是通過某種付費/免費形式,給予部分的人充足的發帖權限的,大家懂就好。
但是其他業務的貼吧,盡量把ID也作為一個指標進行統計,如ID的數量。(多樣化)同理,其他想要的數據我們也可以這樣一層層的剝離。這樣就可以非常簡單的搭建自己的信息源了。