熱點(diǎn)詞可以大大提升時(shí)效性,百度與搜狗搜索的熱點(diǎn)詞采集是首選。今天,錯(cuò)誤博客(cuowu.com)分享的內(nèi)容為《百度搜狗熱點(diǎn)詞采集》。希望對(duì)大家有所幫助。
一、百度熱搜
描述:百度熱搜以數(shù)億用戶海量的真實(shí)數(shù)據(jù)為基礎(chǔ),通過專業(yè)的數(shù)據(jù)挖掘方法,計(jì)算關(guān)鍵詞的熱搜指數(shù),旨在建立權(quán)威、全面、熱門、時(shí)效的各類關(guān)鍵詞排行榜,引領(lǐng)熱詞閱讀時(shí)代。
網(wǎng)址:
https://top.baidu.com/board
二、搜狗熱搜榜
描述:搜狗熱搜榜包括實(shí)時(shí)熱點(diǎn)、熱門電影、熱點(diǎn)電視劇、熱門綜藝、熱門動(dòng)漫、熱門小說、熱門游戲、熱門音樂、熱門汽車與熱門人物等。
網(wǎng)址:
https://top.baidu.com/board
三、搜狗百度熱點(diǎn)詞采集
直接將下面的php代碼保存到php文件中,然后再創(chuàng)建相對(duì)位置下的./cuowucom/redianci/,也就可以直接把熱點(diǎn)詞輸出在瀏覽器中,同時(shí)保存到這個(gè)文件夾下新生成的txt中。
<?php
// 搜狗百度熱點(diǎn)采集生成:
$strchulis="";
$sgresult="";
$baidustr1 = file_get_contents("
http://top.baidu.com/buzz/top10.html"); //民生時(shí)時(shí)熱點(diǎn)關(guān)鍵詞
$baidustr2 = file_get_contents("http://top.baidu.com/buzz?b=11&c=513&fr=topcategory_c513"); //體育時(shí)時(shí)熱點(diǎn)關(guān)鍵詞
$baidustr3 = file_get_contents("http://top.baidu.com/buzz?b=344&c=513&fr=topcategory_c513"); //娛樂時(shí)時(shí)熱點(diǎn)關(guān)鍵詞
for ($x=1; $x<=3; $x++) {
$sgstr1 = file_get_contents("
http://top.sogou.com/hot/sevendsnews_".$x.".html"); //搜狗3頁(yè)七日熱點(diǎn)
$sgstr2 = file_get_contents("
http://top.sogou.com/hot/shishi_".$x.".html"); //搜狗3頁(yè)時(shí)時(shí)熱點(diǎn)
$sgstr3 = file_get_contents("
http://top.sogou.com/movie/all_".$x.".html"); //搜狗電影時(shí)時(shí)熱點(diǎn)
$sgstr4 = file_get_contents("
http://top.sogou.com/tvplay/all_".$x.".html"); //搜狗電視劇時(shí)時(shí)熱點(diǎn)
$sgstr5 = file_get_contents("
http://top.sogou.com/tvshow/all_".$x.".html"); //搜狗綜藝時(shí)時(shí)熱點(diǎn)
$sgstr6 = file_get_contents("
http://top.sogou.com/animation/all_".$x.".html"); //搜狗動(dòng)漫時(shí)時(shí)熱點(diǎn)
$sgstr7 = file_get_contents("
http://top.sogou.com/book/all_".$x.".html"); //搜狗小說時(shí)時(shí)熱點(diǎn)
$sgstr8 = file_get_contents("
http://top.sogou.com/song/newsong_".$x.".html"); //搜狗音樂時(shí)時(shí)熱點(diǎn)
$sgstr9 = file_get_contents("
http://top.sogou.com/game/all_".$x.".html"); //搜狗游戲時(shí)時(shí)熱點(diǎn)
$sgstr10 = file_get_contents("
http://top.sogou.com/auto/all_".$x.".html"); //搜狗汽車時(shí)時(shí)熱點(diǎn)
$sgstr11 = file_get_contents("
http://top.sogou.com/people/all_".$x.".html"); //搜狗人物時(shí)時(shí)熱點(diǎn)
// for循環(huán)過濾搜狗
for ($i=1; $i<=11; $i++) {
preg_match_all('/<p class="p1".*?>.*?</p>/ism', ${"sgstr".$i}, $matchestop); //搜狗過濾函數(shù)
preg_match_all('/<p class="p3".*?>.*?</p>/ism', ${"sgstr".$i}, $matchesbottom); //搜狗過濾函數(shù)
$strtop = join("rn", $matchestop[0]);//搜狗rn換行符,拼接起來
$strbottom = join("rn", $matchesbottom[0]);//搜狗rn換行符,拼接起來
$sgresult.=$strtop.$strbottom;
}
$baidustr = mb_convert_encoding(${"baidustr".$x}, 'UTF-8', 'GB2312');//百度獲取內(nèi)容轉(zhuǎn)碼utf-8
preg_match_all('/<a class="list-title".*?>.*?</a>/ism', $baidustr, $matches); //百度過濾函數(shù)
$baidustr = join("rn", $matches[0]);//結(jié)果百度采集rn換行符,拼接起來
$sgstrend=$sgresult.$baidustr;//結(jié)果搜狗采集關(guān)鍵詞換行
$strchuli = strip_tags($sgstrend);//去掉html標(biāo)簽。
$strchulis.=$strchuli;//賦值給新變量
}
echo $strchulis;//輸出
file_put_contents('./cuowucom/redianci/'.date("Y-m-d").'.txt', $strchulis);//存入txt
?>
以上就是錯(cuò)誤博客(https://cuowu.com/)分享的內(nèi)容為《百度搜狗熱點(diǎn)詞采集》。感謝您的閱讀。更多原創(chuàng)文章搜索“錯(cuò)誤博客”。