2022 年 2 月, 學術數據庫 Sci-Hub 開始對外公布每月的文獻下載統計—— 不論何時,中國用戶在這個網站上的論文下載量都位居全球第一,是第二名美國的近五倍。
2023 年1月使用數據 |圖片來源:Sci-Hub
中國用戶和 Sci-Hub 的關系升溫于 2020 年的一個小插曲。當年 5 月, Sci-Hub 創始人亞歷山德拉·埃爾巴金(Alexandra Elbakyan)在網站主頁上添加了一張 GIF 動圖: 圖中她揮舞著手,身穿一件印有“發送”字樣的襯衫,面帶微笑,有張肉肉的臉。這激起了人們的好奇,知乎上,“ Sci-Hub 左下角在招手的神秘女人是誰?”的相關解答收獲上萬點贊。
圖片來源:Sci-Hub
那之后,數千封郵件突如其來地淹沒了埃爾巴金的郵箱,其中一些“非常冗長而詳盡”。
中國用戶親切地將 Sci-Hub 稱呼為“小鳥”,稱埃爾巴金為“學術女神”;Sci-Hub 則在最近的一次更新中,將 logo 小鳥口銜的鑰匙變成了一把鐮刀錘頭。但看似和諧的關系背后是各自深陷的困境—— 埃爾巴金不斷被美國、印度的出版商起訴;中國的科研人員則“苦知網久已”。
盡情擁抱 Sci-Hub 之時,中國科研從業者也響應學術開放的口號,探索著一條隱秘之路。
再造一條船
一戰成名的故事開始于程序員論壇 ycombinator 上的一個帖子,內容簡單直接: Sci-Bay:谷歌學術和 Sci-Hub 的合體。后面附帶了網站鏈接。
一石千層浪。“這太棒了!”撲面而來的溢美之詞帶來了訪問量的飆升,網站每天的日活數達到兩萬多人,分布在世界各地。
維基百科對 Sci-Hub 的定性是影子圖書館,一種繞過出版社付費墻,將文獻開放給大眾的在線數據庫。Sci-Bay(意為科學海盜灣) 是一個與 Sci-Hub 高度類似的工具,被很多用戶視為后者的“升級版”——Sci-Hub 只能用 DOI 號找論文,Sci-Bay 則允許用戶使用關鍵詞進行檢索。
圖片來源:pixabay
相較于 Sci-Hub 和埃爾巴金的高調,Sci-Bay 的來歷是個謎團。“有誰知道 Sci-Bay 創始者的信息么?” 2018 年三月,曾為《大眾科學》、《科學美國人》等媒體撰稿的美國記者 Ian Graber-Stiehl 在一個技術論壇上求助發問。此前不久,他剛在 The Verge 上發表了一篇關于埃爾巴金的深度長文,正想乘勝追擊。他說,“據我了解,全世界最知名的一些期刊編輯都希望能盡快做一篇關于 Sci-Bay 的報道。”
五年后, Dongning 再次回憶起當時的狀況,仍感到不可思議。 他并非互聯網創業者,創建 Sci-Bay 也不是為了營利。這個網站做的唯一推廣,只有那個帖子。
他看到媒體在四處打聽,思前想后,考慮到各種風險,還是決定不要現身。直到現在,也幾乎沒人知道那個平臺背后的運營者來自中國。
Dongning 屬于中國最早接觸到 Sci-Hub 的那批人。在他的印象中, Sci-Hub 的用戶爆發期是 2016 年。也就是在那一年,“白嫖”了三年的他開始考慮對 Sci-Hub 進行改良——作為材料領域的學術人員,他知道研究者的需求, 他們希望能在查閱文獻的同時,可以對比期刊信息、主題、影響因子,在浩瀚的論文之海中找到對自己有用的那一篇。
他把 Sci-Bay 和 Sci-Hub 的關系定義為升級而非競爭。在他看來,如果成功, Sci-Hub 也將是獲益者,“不然你隨便看見一個文件就去下載,對 Sci-Hub 的服務器會造成很大的壓力。”
“升級改造”所需的主要技術是 Python/ target=_blank class=infotextkey>Python 編程,以他當時的水平只算了解些皮毛。但很快他就在開源平臺上找到了一個谷歌學術的代理工具。他將兩者進行了功能的整合,像搭樂高一樣拼在一起。只一兩個月之后,一個擁有檢索功能的類 Sci-Hub 平臺便初具雛形。
像是憑印象搭了一艘船,手邊全是臨時找來的廢舊材料。網站剛一上線,常是每兩個小時就會例行崩潰,只能手動重啟。Dongning 就再返回去學架構、服務器知識,不停地往船上打補丁。
圖片來源:unsplash
但仍有成千上萬的人搭上了這艘船,搖搖蕩蕩來到了對岸。上線大概一個月時間,這個工具的訪問增長到每天將近有一萬人左右。為了改進技術并實現用戶交流,Dongning 還設置了一個兩千人的 QQ 群,結果幾天就被加滿,不得不找了一些志愿者跟他一起進行維護。
后來他將這些功能都聚合到一個網站上,模仿一些技術論壇的中文社群,建立了一個基于 Sci-Hub 的在線社區。
Sci-Hub 和它的中國擁躉
實際上, 龐大的中國用戶群體一直對 Sci-Hub 的運作模式產生著持續的影響。
2013,Sci-Hub 創立的第三年,迎來了中國用戶的第一次爆炸式增長。 發現這點后,埃爾巴金先是暫時阻止了來自中國的訪問,以防網站崩潰。緊接著她測試了限流的方法——一度,用戶尋找論文時需要“排隊”才能進入。
在此之前,Sci-Hub 采用的是“下后即焚”的方式,沒有存儲庫,文章被用戶下載后六個小時就會自動刪除。來自中國、瘋狂增長的請求數讓這種模式無法再延續,埃爾巴金轉而從頁面中提取 DOI,將用戶重新定向到更老牌的文獻數據庫 LibGen 。
2013 年下半年,LibGen 內部出現嚴重的存儲問題,大約四萬篇論文丟失。埃爾巴金決定發起眾籌,購買硬盤,建立自己的文獻副本—— 這才讓 Sci-Hub 更接近如今的模樣,一個包含數千萬篇論文的巨大存儲庫。
2021 年 8 月,Sci-Hub 接收捐款的賬戶被封,應用戶要求,埃爾巴金在支付寶上開設了一個賬戶。 立刻,大量的捐款開始涌入。至于具體收到的金額,埃爾巴金表示,支付寶的提款限制是每年三萬美金,在達到限額后,她沒有再積極地進行統計和收集。
但總體來看,2021 年 Sci-Hub 收到的所有捐款中,來自中國用戶的捐款占比達到了 30% 到 50%。
許多用戶發信希望網站能增加中文的語言選項,作為回應,埃爾巴金在幾個月前的一次更新中為 Sci-Hub 增添了這個功能。
圖片來源:知乎截圖
一起打游擊
圍繞 Sci-Hub 存在一個現象, 每次被封鎖、被訴訟都只是讓它的名氣變得更大,獲得的支持更多。這體現出它在輿論中占據的上風。
2015 年 6 月,愛思唯爾(全世界最大的出版商之一)對 Sci-Hub 提起版權訴訟,讓被告聲名鵲起。但這場敗訴也讓 Sci-Hub 丟掉了自己 Sci-Hub.org 的域名。自此,它進入了一種四處游擊,不斷搬家的狀態,先后使用過 .ac、 .io、 .cc 等不同后綴。
迄今為止,它的官方域名已經更換數次。原本埃爾巴金依賴 Twitter 作為窗口,向用戶隨時更新最新域名。在 2021 年,Sci-Hub 的幾個 Twitter 賬戶也接連被封。
2022 年 11 月,同為影子圖書館的 Z-lib 域名也遭美國司法部查封,引發廣泛的不滿|圖片來源:bleepingcomputer
因此,幾乎所有 Sci-Hub 的中文社群最初都是為了這個單純的目的聚集到一起——獲知 Sci-Hub 的最新地址。
YoviSun 便是其中之一。起初,他基于個人興趣建立了一個網站,實時更新 Sci-Hub 的可用網址鏈接。為了彌補部分用戶無法登陸 Sci-Hub 的問題,他又建立了 QQ 群,那些無法登陸網站的人可以在群內求助,總會有熱心人伸出援手。
最終,這個模式在 2020 年衍生出一個非盈利性的科研互助平臺“科研通”。 “科學是屬于全人類的,它本不應該有障礙。”平臺介紹中,YoviSun 如此寫道,“大家站在巨人的肩膀上,才更有可能跳得更遠。”
對于有資源的人來說,別人四處難尋的文獻,只需點點鼠標就可以獲取。阿萊是科研通的一名熱心志愿者, 據他粗略估算,對于表述清晰無誤的求助,他平均的回應時間只要 20 秒。
過去半年多,他的應助數量高達兩萬多次,也就是說,兩萬篇被需要的論文由他搬運到了壟斷出版機構的墻壁之外,發送給求助之人。這是不菲的成績,他的活躍讓他在網站的應助榜上留下名字。應助前十的人能看到一些網站運行的內部數據。他查看發現,科研通每一天的應助人次都在萬次以上。
一定程度上,阿萊將此視為一種互惠投資。 “我也不會一直在一個(訪問科研文獻)權限好的學校待下去,就當成現在幫別人,好讓以后也有人能幫自己吧。”
一開始,科研通的功能和 Sci-Hub 重度重疊,但事情在 2021 年走到一個分水嶺。
2021 年,Sci-Hub 在印度再次遭遇大規模訴訟,繼而停止了對新論文的上傳。同年 9 月,為慶祝成立十周年,埃爾巴金進行了一輪大規模的論文上傳,但最新的論文仍有許多缺失。幾乎所有基于 Sci-Hub 的索引平臺也受牽連,可下載的論文也就停留在了 2021 年。
從這時起,科研通點對點互助模式就顯出優越性,平臺的活躍度一下子提升起來。
科研通承繼了 Sci-Hub 基因當中最原初的那個部分:互助精神。
繞過出版商的付費墻是非法的,但用自己的賬戶幫朋友下一篇論文呢?那么十篇呢?一百篇呢?一百萬篇呢?
外界一直對 Sci-Hub 龐大的論文來源充滿好奇,對此埃爾巴金只透露過少量信息: 早期許多賬號都來自于身處高校或研究機構內部的教授或學生,他們志愿貢獻出自己的用戶名和密碼,直接發送到她的郵箱里。埃爾巴金記得,其中有一部分文獻和密碼就是與中文的學術論壇科研速遞(expaper.cn)合作而取得的 。
對于很多人來說,這或許跟朋友之間共享一個 B 站或.NETflix 賬號并無二致。
友情提醒:如果在 Sci-Hub 上找不到你要的論文,嘗試直接給作者發郵件,他們通常都會很樂意給你發一份全文|來源:Sci-Hub Twitter
從來沒有救世主
學術研究者與學術出版商之間的矛盾,全球同此涼熱。
在中國,學術成本同樣高企, 相比于每年漲價 5% 的愛思唯爾,中國知網從 2010 年到 2016 年平均每年提價了近 20% 。
Sci-Hub 暴打收費期刊 meme|圖片來源:Sci-Hub Twitter
運營 Sci-Hub 社區的過程中, Dongning 常收到求助郵件。其中有幾位讓他印象尤其深刻:一些年齡比較大、在他看來相當有年資的高校老教授,也會為了 Sci-Hub 聯系到他們,大多是為尋找一篇特定的論文,也有的會對網站的功能提些反饋意見。
“有一些真的資歷特別高,院士級別的吧。我很驚訝是因為, 你會以為,憑借他們本身的資歷,想要獲取文獻會有很多途徑,不需要通過 Sci-Hub ,但實際情況不是這樣。”
抵制促進了開放。2021 年的重新談判中,加州大學與愛思唯爾簽署了里程碑意義的協議。愛思唯爾破天荒同意,將前者在其上發表的研究成果免費開放給世界上任何地方的任何人。
民意沸騰下,知網也被責令整改。經過半年的調查,2022 年 12 月 26 日,國家市場監管總局發布公告:確認知網濫用市場支配地位,處以其 2021 年中國境內銷售額 17.52 億元 5% 的罰款,計 8760 萬元,并提出整改獨家合作、大幅降低數據庫服務價格在內的 15 條整改措施。
不同于 Sci-Hub 、Sci-Bay 和科研通所代表的隱秘、灰暗的抗爭,為爭取學術開發,還存在一條看似更為光明的岔路—— 已經進行了數十年的開放獲取運動(Open Access)。
開放獲取運動并非沒有成果:2013 年,奧巴馬政府規定,所有通過美國聯邦機構進行的研究,必須在發表一年內上傳副本到免費資源庫;壓力之下,全世界的出版商巨頭陸續推出開放獲取期刊,如今根據地區的不同,OA 對現有論文的覆蓋率在 27.9% 到 53.7% 不等;也存在 arXiv 這樣的在線數據庫,供研究者上傳存檔尚未經同行審議的論文。
然而,這場始自 2001 年的運動步調實在太過緩慢,慢得讓人們幾乎失去耐心。 更糟糕的是,開放獲取的成本也常常被轉嫁到論文作者的身上。Dongning 介紹,如今在論文出版的時候,出版商會問要不要選擇 OA(Open Access),選擇的話,作者就要自行交付非常昂貴的版面費(又稱文章處理費 APC);不選擇 OA, 版面費會低一點,但能接觸到這篇論文的人就會少得多。
比如,根據期刊不同,愛思唯爾的 APC 價格在 200 美元到 10100 美元之間;美國國家科學院院刊(PNAS)的即時開放獲取價格為 5495 美元(合約 3.7 萬人民幣)。因而坊間有調侃,“ OA 期刊出現以前,有人窮得讀不起好文章;OA 期刊出現以后,有人窮得發不起文章”。
2013 年 reddit 創始人亞倫·斯沃茨自殺。此前他曾因利用個人學生賬號大規模下載學術文獻遭到起訴,面臨最高 35 年的刑期|圖片來源:《互聯網之子》海報
埃爾巴金來看,Sci-Hub 和開放獲取(OA)并不應簡單地以“合法”與否作為區分。“ 2001 年開放獲取運動出現時,沒有人談論它必須是‘合法’的——這樣的問題根本就沒有出現過!人們談論的是如何讓獲取科學變得免費、開放,以及,如何將科學擴展到所有人而不僅僅是專業研究人員。”
她提到,事實上,當科學家在一些學術社交平臺,比如 ResearchGate 或 Academia 上分享他們的工作成果時,也常會被愛思唯爾告上法庭。最終,許多不得不服從于訴訟,將自己的論文刪除。
“開放獲取中的‘合法性’問題是在 Sci-Hub 出現后才成為一個問題。 基本上,Sci-Hub 只是更激進的開放獲取,目標是讓科學變得開放,即使有人說它不完全合法。”
但這種區分仍給 Sci-Hub 帶來了真實的麻煩。如今,由于深陷訴訟,論文的上傳已經停滯,埃爾巴金希望未來能夠恢復。她還夢想加入人工智能的功能,讓 Sci-Hub 能自動翻譯論文,或是用自然語言回答關于科學的問題……
現實中,科研學術人員還是離不開 Sci-Hub 和它的海盜團。
“(Sci-Hub)這樣的網站,它的存在本身就是一場悲劇。” Palladium 雜志評論道,“ 它填補了一個本不該存在的利基市場,就像買不起處方藥的人只能在黑市買藥。它的存在本身,就是在控訴讓它能夠出現的外部環境。”
誰也說不準這場悲劇將如何收場,就連海盜自己也不愿盡情高歌。
(文內 Dongning、阿萊均為化名)
參考文獻
[3] https://www.reddit.com/r/hacking/comments/868mqd/academic_piracy_journalist_know_anything_about/
[5] https://engineuring.wordPress/ target=_blank class=infotextkey>WordPress.com/2017/07/02/some-facts-on-sci-hub-that-wikipedia-gets-wrong/
[7] https://www.theguardian.com/science/2012/apr/24/harvard-university-journal-publishers-prices
[8] https://www.insidehighered.com/news/2019/03/01/university-california-cancels-deal-elsevier-after-months-negotiations
[10] https://huacheng.gz-cmc.com/pages/2021/12/13/6371cccd1a804c12809a401ef2df0aa3.html
[12] https://news.berkeley.edu/2021/03/16/ucs-deal-with-elsevier-what-it-took-what-it-means-why-it-matters/
[16] https://www.palladiummag.com/2021/09/24/a-world-without-sci-hub/
[17] https://www.pnas.org/author-center/publication-charges
作者:翁垟
編輯:臥蟲