網(wǎng)絡(luò)消費網(wǎng) >  科技 > > 正文
2023年了,為什么我們還需要“非法的”Sci-Hub?
時間:2023-02-10 10:20:45

2022 年 2 月, 學術(shù)數(shù)據(jù)庫 Sci-Hub 開始對外公布每月的文獻下載統(tǒng)計——不論何時,中國用戶在這個網(wǎng)站上的論文下載量都位居全球第一,是第二名美國的近五倍。


(資料圖片僅供參考)

2023 年1月使用數(shù)據(jù) |圖片來源:Sci-Hub

中國用戶和 Sci-Hub 的關(guān)系升溫于 2020 年的一個小插曲。當年 5 月, Sci-Hub 創(chuàng)始人亞歷山德拉·埃爾巴金(Alexandra Elbakyan)在網(wǎng)站主頁上添加了一張 GIF 動圖:圖中她揮舞著手,身穿一件印有“發(fā)送”字樣的襯衫,面帶微笑,有張肉肉的臉。這激起了人們的好奇,知乎上,“ Sci-Hub 左下角在招手的神秘女人是誰?”的相關(guān)解答收獲上萬點贊。

圖片來源:Sci-Hub

那之后,數(shù)千封郵件突如其來地淹沒了埃爾巴金的郵箱,其中一些“非常冗長而詳盡”。

中國用戶親切地將 Sci-Hub 稱呼為“小鳥”,稱埃爾巴金為“學術(shù)女神”;Sci-Hub 則在最近的一次更新中,將 logo 小鳥口銜的鑰匙變成了一把鐮刀錘頭。但看似和諧的關(guān)系背后是各自深陷的困境——埃爾巴金不斷被美國、印度的出版商起訴;中國的科研人員則“苦知網(wǎng)久已”。

盡情擁抱 Sci-Hub 之時,中國科研從業(yè)者也響應(yīng)學術(shù)開放的口號,探索著一條隱秘之路。

再造一條船

一戰(zhàn)成名的故事開始于程序員論壇 ycombinator 上的一個帖子,內(nèi)容簡單直接:Sci-Bay:谷歌學術(shù)和 Sci-Hub 的合體。后面附帶了網(wǎng)站鏈接。

一石千層浪?!斑@太棒了!”撲面而來的溢美之詞帶來了訪問量的飆升,網(wǎng)站每天的日活數(shù)達到兩萬多人,分布在世界各地。

維基百科對 Sci-Hub 的定性是影子圖書館,一種繞過出版社付費墻,將文獻開放給大眾的在線數(shù)據(jù)庫。Sci-Bay(意為科學海盜灣) 是一個與 Sci-Hub 高度類似的工具,被很多用戶視為后者的“升級版”——Sci-Hub 只能用 DOI 號找論文,Sci-Bay 則允許用戶使用關(guān)鍵詞進行檢索。

圖片來源:pixabay

相較于 Sci-Hub 和埃爾巴金的高調(diào),Sci-Bay 的來歷是個謎團?!坝姓l知道 Sci-Bay 創(chuàng)始者的信息么?” 2018 年三月,曾為《大眾科學》、《科學美國人》等媒體撰稿的美國記者 Ian Graber-Stiehl 在一個技術(shù)論壇上求助發(fā)問。此前不久,他剛在 The Verge 上發(fā)表了一篇關(guān)于埃爾巴金的深度長文,正想乘勝追擊。他說,“據(jù)我了解,全世界最知名的一些期刊編輯都希望能盡快做一篇關(guān)于 Sci-Bay 的報道?!?/p>

五年后, Dongning 再次回憶起當時的狀況,仍感到不可思議。他并非互聯(lián)網(wǎng)創(chuàng)業(yè)者,創(chuàng)建 Sci-Bay 也不是為了營利。這個網(wǎng)站做的唯一推廣,只有那個帖子。

他看到媒體在四處打聽,思前想后,考慮到各種風險,還是決定不要現(xiàn)身。直到現(xiàn)在,也幾乎沒人知道那個平臺背后的運營者來自中國。

Dongning 屬于中國最早接觸到 Sci-Hub 的那批人。在他的印象中, Sci-Hub 的用戶爆發(fā)期是 2016 年。也就是在那一年,“白嫖”了三年的他開始考慮對 Sci-Hub 進行改良——作為材料領(lǐng)域的學術(shù)人員,他知道研究者的需求,他們希望能在查閱文獻的同時,可以對比期刊信息、主題、影響因子,在浩瀚的論文之海中找到對自己有用的那一篇。

他把 Sci-Bay 和 Sci-Hub 的關(guān)系定義為升級而非競爭。在他看來,如果成功, Sci-Hub 也將是獲益者,“不然你隨便看見一個文件就去下載,對 Sci-Hub 的服務(wù)器會造成很大的壓力?!?/p>

“升級改造”所需的主要技術(shù)是 Python 編程,以他當時的水平只算了解些皮毛。但很快他就在開源平臺上找到了一個谷歌學術(shù)的代理工具。他將兩者進行了功能的整合,像搭樂高一樣拼在一起。只一兩個月之后,一個擁有檢索功能的類 Sci-Hub 平臺便初具雛形。

像是憑印象搭了一艘船,手邊全是臨時找來的廢舊材料。網(wǎng)站剛一上線,常是每兩個小時就會例行崩潰,只能手動重啟。Dongning 就再返回去學架構(gòu)、服務(wù)器知識,不停地往船上打補丁。

圖片來源:unsplash

但仍有成千上萬的人搭上了這艘船,搖搖蕩蕩來到了對岸。上線大概一個月時間,這個工具的訪問增長到每天將近有一萬人左右。為了改進技術(shù)并實現(xiàn)用戶交流,Dongning 還設(shè)置了一個兩千人的 QQ 群,結(jié)果幾天就被加滿,不得不找了一些志愿者跟他一起進行維護。

后來他將這些功能都聚合到一個網(wǎng)站上,模仿一些技術(shù)論壇的中文社群,建立了一個基于 Sci-Hub 的在線社區(qū)。

Sci-Hub 和它的中國擁躉

實際上,龐大的中國用戶群體一直對 Sci-Hub 的運作模式產(chǎn)生著持續(xù)的影響。

2013,Sci-Hub 創(chuàng)立的第三年,迎來了中國用戶的第一次爆炸式增長。發(fā)現(xiàn)這點后,埃爾巴金先是暫時阻止了來自中國的訪問,以防網(wǎng)站崩潰。緊接著她測試了限流的方法——一度,用戶尋找論文時需要“排隊”才能進入。

在此之前,Sci-Hub 采用的是“下后即焚”的方式,沒有存儲庫,文章被用戶下載后六個小時就會自動刪除。來自中國、瘋狂增長的請求數(shù)讓這種模式無法再延續(xù),埃爾巴金轉(zhuǎn)而從頁面中提取 DOI,將用戶重新定向到更老牌的文獻數(shù)據(jù)庫 LibGen 。

2013 年下半年,LibGen 內(nèi)部出現(xiàn)嚴重的存儲問題,大約四萬篇論文丟失。埃爾巴金決定發(fā)起眾籌,購買硬盤,建立自己的文獻副本——這才讓 Sci-Hub 更接近如今的模樣,一個包含數(shù)千萬篇論文的巨大存儲庫。

2021 年 8 月,Sci-Hub 接收捐款的賬戶被封,應(yīng)用戶要求,埃爾巴金在支付寶上開設(shè)了一個賬戶。立刻,大量的捐款開始涌入。至于具體收到的金額,埃爾巴金表示,支付寶的提款限制是每年三萬美金,在達到限額后,她沒有再積極地進行統(tǒng)計和收集。

但總體來看,2021 年 Sci-Hub 收到的所有捐款中,來自中國用戶的捐款占比達到了 30% 到 50%。

許多用戶發(fā)信希望網(wǎng)站能增加中文的語言選項,作為回應(yīng),埃爾巴金在幾個月前的一次更新中為 Sci-Hub 增添了這個功能。

圖片來源:知乎截圖

一起打游擊

圍繞 Sci-Hub 存在一個現(xiàn)象,每次被封鎖、被訴訟都只是讓它的名氣變得更大,獲得的支持更多。這體現(xiàn)出它在輿論中占據(jù)的上風。

2015 年 6 月,愛思唯爾(全世界最大的出版商之一)對 Sci-Hub 提起版權(quán)訴訟,讓被告聲名鵲起。但這場敗訴也讓 Sci-Hub 丟掉了自己 Sci-Hub.org 的域名。自此,它進入了一種四處游擊,不斷搬家的狀態(tài),先后使用過 .ac、 .io、 .cc 等不同后綴。

迄今為止,它的官方域名已經(jīng)更換數(shù)次。原本埃爾巴金依賴 Twitter 作為窗口,向用戶隨時更新最新域名。在 2021 年,Sci-Hub 的幾個 Twitter 賬戶也接連被封。

2022 年 11 月,同為影子圖書館的 Z-lib 域名也遭美國司法部查封,引發(fā)廣泛的不滿|圖片來源:bleepingcomputer

因此,幾乎所有 Sci-Hub 的中文社群最初都是為了這個單純的目的聚集到一起——獲知 Sci-Hub 的最新地址。

YoviSun 便是其中之一。起初,他基于個人興趣建立了一個網(wǎng)站,實時更新 Sci-Hub 的可用網(wǎng)址鏈接。為了彌補部分用戶無法登陸 Sci-Hub 的問題,他又建立了 QQ 群,那些無法登陸網(wǎng)站的人可以在群內(nèi)求助,總會有熱心人伸出援手。

最終,這個模式在 2020 年衍生出一個非盈利性的科研互助平臺“科研通”。“科學是屬于全人類的,它本不應(yīng)該有障礙?!?/strong>平臺介紹中,YoviSun 如此寫道,“大家站在巨人的肩膀上,才更有可能跳得更遠。”

對于有資源的人來說,別人四處難尋的文獻,只需點點鼠標就可以獲取。阿萊是科研通的一名熱心志愿者,據(jù)他粗略估算,對于表述清晰無誤的求助,他平均的回應(yīng)時間只要 20 秒。

過去半年多,他的應(yīng)助數(shù)量高達兩萬多次,也就是說,兩萬篇被需要的論文由他搬運到了壟斷出版機構(gòu)的墻壁之外,發(fā)送給求助之人。這是不菲的成績,他的活躍讓他在網(wǎng)站的應(yīng)助榜上留下名字。應(yīng)助前十的人能看到一些網(wǎng)站運行的內(nèi)部數(shù)據(jù)。他查看發(fā)現(xiàn),科研通每一天的應(yīng)助人次都在萬次以上。

一定程度上,阿萊將此視為一種互惠投資。“我也不會一直在一個(訪問科研文獻)權(quán)限好的學校待下去,就當成現(xiàn)在幫別人,好讓以后也有人能幫自己吧?!?/strong>

一開始,科研通的功能和 Sci-Hub 重度重疊,但事情在 2021 年走到一個分水嶺。

2021 年,Sci-Hub 在印度再次遭遇大規(guī)模訴訟,繼而停止了對新論文的上傳。同年 9 月,為慶祝成立十周年,埃爾巴金進行了一輪大規(guī)模的論文上傳,但最新的論文仍有許多缺失。幾乎所有基于 Sci-Hub 的索引平臺也受牽連,可下載的論文也就停留在了 2021 年。

從這時起,科研通點對點互助模式就顯出優(yōu)越性,平臺的活躍度一下子提升起來。

科研通承繼了 Sci-Hub 基因當中最原初的那個部分:互助精神。

繞過出版商的付費墻是非法的,但用自己的賬戶幫朋友下一篇論文呢?那么十篇呢?一百篇呢?一百萬篇呢?

截止 1 月 29 日,據(jù)其官網(wǎng), Sci-hub 所收納的論文數(shù)量已經(jīng)達到 88343822 篇,對主要科學出版社的覆蓋率都在 95% 以上。

外界一直對 Sci-Hub 龐大的論文來源充滿好奇,對此埃爾巴金只透露過少量信息:早期許多賬號都來自于身處高?;蜓芯繖C構(gòu)內(nèi)部的教授或?qū)W生,他們志愿貢獻出自己的用戶名和密碼,直接發(fā)送到她的郵箱里。埃爾巴金記得,其中有一部分文獻和密碼就是與中文的學術(shù)論壇科研速遞(expaper.cn)合作而取得的 。

對于很多人來說,這或許跟朋友之間共享一個 B 站或 Netflix 賬號并無二致。

友情提醒:如果在 Sci-Hub 上找不到你要的論文,嘗試直接給作者發(fā)郵件,他們通常都會很樂意給你發(fā)一份全文|來源:Sci-Hub Twitter

從來沒有救世主

學術(shù)研究者與學術(shù)出版商之間的矛盾,全球同此涼熱。

據(jù)統(tǒng)計,擁有《柳葉刀》(The Lancet) 和《細胞》(Cell) 的出版商愛思唯爾對單篇論文的獲取平均收費高達 31.5 美金(約 220 元)。2012 年,哈佛向全校數(shù)千名師生發(fā)表備忘錄,表示難以承擔每年高達 350 萬美金的訂閱費用;2019 年,包含十座校區(qū)的加州大學系統(tǒng)宣布停止對愛思唯爾的訂閱。

在中國,學術(shù)成本同樣高企,相比于每年漲價 5% 的愛思唯爾,中國知網(wǎng)從 2010 年到 2016 年平均每年提價了近 20% 。

2013 年底,云南省多所高校因為漲價停用知網(wǎng);2016 年 3 月,北大一度貼出“可能停用知網(wǎng)”的通知;2021 年 3 月,浙江理工大學法政學院特聘副教授郭兵以“濫用市場支配地位”為由起訴知網(wǎng);2022 年 4 月,網(wǎng)傳中科院將停用知網(wǎng),因“訂購總費用已達到千萬級別”,引燃輿論。微博話題“#中科院回應(yīng)停用知網(wǎng)#”、“#知網(wǎng)漲價是否傷害了科研環(huán)境#”等閱讀量累計超過 6 億。

Sci-Hub 暴打收費期刊 meme|圖片來源:Sci-Hub Twitter

運營 Sci-Hub 社區(qū)的過程中, Dongning 常收到求助郵件。其中有幾位讓他印象尤其深刻:一些年齡比較大、在他看來相當有年資的高校老教授,也會為了 Sci-Hub 聯(lián)系到他們,大多是為尋找一篇特定的論文,也有的會對網(wǎng)站的功能提些反饋意見。

“有一些真的資歷特別高,院士級別的吧。我很驚訝是因為,你會以為,憑借他們本身的資歷,想要獲取文獻會有很多途徑,不需要通過 Sci-Hub ,但實際情況不是這樣。

抵制促進了開放。2021 年的重新談判中,加州大學與愛思唯爾簽署了里程碑意義的協(xié)議。愛思唯爾破天荒同意,將前者在其上發(fā)表的研究成果免費開放給世界上任何地方的任何人。

民意沸騰下,知網(wǎng)也被責令整改。經(jīng)過半年的調(diào)查,2022 年 12 月 26 日,國家市場監(jiān)管總局發(fā)布公告:確認知網(wǎng)濫用市場支配地位,處以其 2021 年中國境內(nèi)銷售額 17.52 億元 5% 的罰款,計 8760 萬元,并提出整改獨家合作、大幅降低數(shù)據(jù)庫服務(wù)價格在內(nèi)的 15 條整改措施。

不同于 Sci-Hub 、Sci-Bay 和科研通所代表的隱秘、灰暗的抗爭,為爭取學術(shù)開發(fā),還存在一條看似更為光明的岔路——已經(jīng)進行了數(shù)十年的開放獲取運動(Open Access)

開放獲取運動并非沒有成果:2013 年,奧巴馬政府規(guī)定,所有通過美國聯(lián)邦機構(gòu)進行的研究,必須在發(fā)表一年內(nèi)上傳副本到免費資源庫;壓力之下,全世界的出版商巨頭陸續(xù)推出開放獲取期刊,如今根據(jù)地區(qū)的不同,OA 對現(xiàn)有論文的覆蓋率在 27.9% 到 53.7% 不等;也存在 arXiv 這樣的在線數(shù)據(jù)庫,供研究者上傳存檔尚未經(jīng)同行審議的論文。

然而,這場始自 2001 年的運動步調(diào)實在太過緩慢,慢得讓人們幾乎失去耐心。更糟糕的是,開放獲取的成本也常常被轉(zhuǎn)嫁到論文作者的身上。Dongning 介紹,如今在論文出版的時候,出版商會問要不要選擇 OA(Open Access),選擇的話,作者就要自行交付非常昂貴的版面費(又稱文章處理費 APC);不選擇 OA, 版面費會低一點,但能接觸到這篇論文的人就會少得多。

比如,根據(jù)期刊不同,愛思唯爾的 APC 價格在 200 美元到 10100 美元之間;美國國家科學院院刊(PNAS)的即時開放獲取價格為 5495 美元(合約 3.7 萬人民幣)。因而坊間有調(diào)侃,“ OA 期刊出現(xiàn)以前,有人窮得讀不起好文章;OA 期刊出現(xiàn)以后,有人窮得發(fā)不起文章”。

2013 年 reddit 創(chuàng)始人亞倫·斯沃茨自殺。此前他曾因利用個人學生賬號大規(guī)模下載學術(shù)文獻遭到起訴,面臨最高 35 年的刑期|圖片來源:《互聯(lián)網(wǎng)之子》海報

埃爾巴金來看,Sci-Hub 和開放獲?。∣A)并不應(yīng)簡單地以“合法”與否作為區(qū)分。“ 2001 年開放獲取運動出現(xiàn)時,沒有人談?wù)撍仨毷恰戏ā摹@樣的問題根本就沒有出現(xiàn)過!人們談?wù)摰氖侨绾巫尗@取科學變得免費、開放,以及,如何將科學擴展到所有人而不僅僅是專業(yè)研究人員?!?/p>

她提到,事實上,當科學家在一些學術(shù)社交平臺,比如 ResearchGate 或 Academia 上分享他們的工作成果時,也常會被愛思唯爾告上法庭。最終,許多不得不服從于訴訟,將自己的論文刪除。

“開放獲取中的‘合法性’問題是在 Sci-Hub 出現(xiàn)后才成為一個問題。基本上,Sci-Hub 只是更激進的開放獲取,目標是讓科學變得開放,即使有人說它不完全合法。

但這種區(qū)分仍給 Sci-Hub 帶來了真實的麻煩。如今,由于深陷訴訟,論文的上傳已經(jīng)停滯,埃爾巴金希望未來能夠恢復(fù)。她還夢想加入人工智能的功能,讓 Sci-Hub 能自動翻譯論文,或是用自然語言回答關(guān)于科學的問題……

現(xiàn)實中,科研學術(shù)人員還是離不開 Sci-Hub 和它的海盜團。

“(Sci-Hub)這樣的網(wǎng)站,它的存在本身就是一場悲劇?!?Palladium 雜志評論道,“它填補了一個本不該存在的利基市場,就像買不起處方藥的人只能在黑市買藥。它的存在本身,就是在控訴讓它能夠出現(xiàn)的外部環(huán)境。

誰也說不準這場悲劇將如何收場,就連海盜自己也不愿盡情高歌。

關(guān)鍵詞: 埃爾巴金 sci-bay

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。
    除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 www.netfop.cn All Rights Reserved.
 

中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息