1. 程式人生 > 資訊 >大神開發 arXiv 全新 H5 版:一步告別公式排版錯誤,手機也能輕鬆看文獻

大神開發 arXiv 全新 H5 版:一步告別公式排版錯誤,手機也能輕鬆看文獻

arXiv 幾乎是每個科研人員都必須用到的網站,但是它已經快 31 歲了。1991 年誕生的 arXiv,網站排版顯得與這個時代有些格格不入了。

尤其是在行動網路普及的今天,科研文獻一般使用兩列排版,手機上不放大根本沒法看 PDF。雖說也有 arXiv-vanity 這樣的網頁,但是你看到下面排版不會血壓飆升嗎?

為了讓你能夠更高效地搞科研,最近一位程式設計師開發了一個 ar5iv 網站,將 arXiv 中的 X 換成了 5,即 HTML5 版 arXiv。

它能夠以現代 HTML5 格式顯示論文。我們先來看一下顯示效果:

LaTeX 公式顯示準確無誤。我們再來看看手機版效果如何:

即使在狹窄的手機頁面上,瀏覽體驗仍然保持不錯,還能呼叫手機自帶翻譯詞典。你以後還敢說自己沒時間看文獻了嗎?(doge)據 Deyan Ginev 這位開發者介紹,目前 ar5iv 已經收錄了 175 萬篇論文,約佔 arXiv 總數的 97%。

ar5iv 特點

ar5iv 的使用非常簡單,只要將網址中的 arXiv 中的 X 換成 5 再回車,頁面就能自動跳轉。

一般只需稍候一兩秒,網頁版論文就閃現在眼前:

像開頭那個 arXiv-vanity 排版混亂的問題,ar5iv 上根本不存在:

調節瀏覽器寬度時,公式排版依舊不亂:

而且 ar5iv 還支援右鍵複製公式的 LaTeX 程式碼:

相比簡陋的 arXiv-vanity,ar5iv 具有以下特點:

  • 對大屏顯示進行優化,尤其適合 Firefox;

  • 支援移動端瀏覽器;

  • 文字對齊,帶有連字元;

  • 支援淺色 / 深色模式切換;

  • ……

開發 ar5iv 的 Deyan Geniv 認為,公眾需要一個方便使用的網頁 TeX / LaTeX 排版。目前在埃朗根-紐倫堡大學讀博士的他,正在研究的 LaTeXML,就是一種將 LaTeX 轉換成 XML、HTML 的工具。

其實早在十幾年前就有人研究將 arXiv 轉換成 LaTeX,隨著 NLP 技術的發展,這種轉換的正確率也得到了明顯提升。作為開源專案 LaTeXML 的貢獻者之一,Geniv 便開發了 ar5iv。

網友開發一鍵轉換外掛

這波操作看下來,研友們著實被秀到了,在 Twitter 上和作者展開熱烈討論,紛紛建言獻策。

其中還有人更進一步,想著能不能出一個瀏覽器外掛,簡化使用 ar5iv 的步驟。

老哥有沒有考慮出一個外掛一鍵切換格式,不用手動改字母?

沒想到還真有熱心的網友做了一個。只需在 GitHub 中下載一個外掛庫(連結在文末),或者直接去 Chrome 應用商店下載 withAr5iv。

這樣下次再開啟論文時,就可以一鍵轉換格式,再點一下還可以轉換回原格式:

不過也有網友注意到 ar5iv 目前的一些缺點。反映比較多的一個問題就是,對於有多個修訂版的論文,ar5iv 只支援顯示論文 v1 版:

轉換論文時只會顯示 v1 版本,但是在 arXiv 上點“PDF”時顯示的是最新版。

作者把這些意見都收錄了起來,表示將來希望和 arXiv 合作一把,一起解決最新版的問題。

瀏覽器外掛:

https://github.com/yobibyte/ar5iv_chrome_ext

參考連結:

[1]https://ar5iv.org/

[2]https://twitter.com/dginev/status/1488157927001268231

[3]https://kwarc.info/people/dginev/