論壇有人反映帝國(guó)CMS的采集功能有近十年沒(méi)更新了,所以團(tuán)隊(duì)對(duì)論壇遇到較多的問(wèn)題進(jìn)行整理,在帝國(guó)CMS7.5版對(duì)采集功能進(jìn)行部分升級(jí),使采集更靈活。
帝國(guó)CMS7.5版采集功能升級(jí),更靈活:
1、采集替換字符設(shè)置 新增支持自定義字段。
2、采集廣告過(guò)濾設(shè)置 新增支持自定義字段。
3、采集驗(yàn)證字段內(nèi)容為空不采集 新增支持自定義字段設(shè)置,并且支持多個(gè)字段同時(shí)驗(yàn)證。
4、采集內(nèi)容分頁(yè)支持自動(dòng)識(shí)別https地址。
5、采集增加入庫(kù)時(shí)間間隔設(shè)置,對(duì)于要遠(yuǎn)程保存附件時(shí),可防止過(guò)度采集被封。
6、管理采集節(jié)點(diǎn)頁(yè)面和執(zhí)行采集頁(yè)面均增加“數(shù)據(jù)更新中心”快捷鏈接,方便采集入庫(kù)后刷新生成當(dāng)天內(nèi)容頁(yè)面。
7、單個(gè)采集執(zhí)行也采用彈窗方式,方便采集過(guò)程中執(zhí)行其它操作,更人性化。
8、帝國(guó)CMS7.5版將PHP超時(shí)時(shí)間設(shè)置前臺(tái)、后臺(tái)分離,方便單獨(dú)對(duì)后臺(tái)超時(shí)時(shí)間改大,防止執(zhí)行或采集過(guò)程中PHP超時(shí)導(dǎo)致中斷。
其它說(shuō)明:
1、另外一個(gè)論壇反映的:關(guān)于GBK版采集其它編碼的網(wǎng)頁(yè),轉(zhuǎn)碼時(shí)有時(shí)候遇特殊字符會(huì)出現(xiàn)轉(zhuǎn)碼不完整問(wèn)題。因暫時(shí)沒(méi)有找到好的通用轉(zhuǎn)換組件能100%轉(zhuǎn)碼GBK成功,對(duì)于經(jīng)常使用采集轉(zhuǎn)碼的用戶(hù),推薦用UTF8編碼版程序,其它編碼轉(zhuǎn)UTF8一般不會(huì)出現(xiàn)特殊字轉(zhuǎn)不了編碼問(wèn)題,畢竟UTF8為國(guó)際通用編碼。
2、采集https的頁(yè)面,需要PHP開(kāi)啟php_openssl.dll組件才可以采集https的網(wǎng)頁(yè)。
上傳以下圖片: