網(wǎng)站首頁 科技 > 正文
根據(jù)一篇新論文,由DeepMind 的人工智能研究人員構(gòu)建的機器學習模型 Ithaca可以猜測缺失的單詞以及書面語言的位置和日期。這項工作可以幫助歷史學家破譯古代手稿。
“Ithaca 是一個深度神經(jīng)網(wǎng)絡(luò),因此,它在大量數(shù)據(jù)中發(fā)現(xiàn)隱藏模式的能力令人難以置信,”最近論文的合著者、歷史學家Thea Sommerschield在電子郵件采訪中告訴 Lifewire。“這種模式可以是文本(語法、句法,或與許多文本中重復的‘公式’相關(guān)聯(lián))或上下文(某些詞在某些文本類型中始終如一地出現(xiàn):例如,古典雅典的一項政治法令提到‘聯(lián)盟,理事會、議會……')。”
揭示過去
Sommerschield 說,Ithaca 是第一個可以恢復受損銘文缺失文本、識別其原始位置并幫助確定其創(chuàng)建日期的深度神經(jīng)網(wǎng)絡(luò)。
伊薩卡島以荷馬的奧德賽中的希臘島嶼命名。研究人員發(fā)現(xiàn),Ithaca 在恢復受損文本方面的準確率達到 62%,在識別其原始位置方面的準確率達到 71%,并且可以將文本的日期追溯到其起源日期的 30 年內(nèi)。
Ithaca 的可視化輔助工具旨在讓研究人員更容易解釋結(jié)果。該論文的作者寫道,歷史學家在單獨修復古代文本時達到了 25% 的準確率。但是,使用 Ithaca 時,歷史學家的性能提高到 72%,超過了模型的性能,并顯示出人機合作的潛力。
“伊薩卡提供了可解釋的輸出,展示了人類專家和機器學習之間合作的重要性,并展示了將人類專家與深度學習架構(gòu)相匹配以協(xié)作處理任務(wù)可以超越人類和模型在相同任務(wù)上的個人(獨立)表現(xiàn),”Sommerschield 告訴 Lifewire。
例如,歷史學家目前不同意一系列重要的雅典法令的日期,這些法令是在蘇格拉底和伯里克利等著名人物生活的時候制定的,Sommerschield 在博客文章中寫道。長期以來,人們一直認為這些法令是在公元前 446/445 年之前制定的,盡管新的證據(jù)表明其日期是公元前 420 年代。“雖然看起來差別很小,但這些法令對于我們理解古典雅典的政治史至關(guān)重要,”她寫道
與伊薩卡最接近的工作是之前的機器學習工具 Pythia,Sommerschield 和她的合作者在 2019 年發(fā)布了該工具。Pythia 是第一個使用深度神經(jīng)網(wǎng)絡(luò)的古代文本恢復模型。
“今天,Ithaca 是第一個從整體上解決碑文工作流程中三個核心任務(wù)的模型,”Sommerschield 在一封電子郵件中說。“它不僅推進了 Pythia 之前最先進的技術(shù),而且還首次以前所未有的規(guī)模將深度學習用于地理和時間歸因。”
AI公司 Singulos Research 的首席執(zhí)行官 Brad Quinton通過電子郵件告訴 Lifewire, AI 可用于填充缺失的數(shù)據(jù),例如文本的位置和日期,因為它擅長通過分析數(shù)據(jù)來學習非常復雜的模式。
“使用機器學習技術(shù),人工智能可以查看大量“已知良好”的示例,以找到例如給定文本及其創(chuàng)建日期和位置之間的模式,”昆頓補充道。“通常,這些模式非常復雜,以至于對人類專家來說并不明顯。”
預(yù)測缺失數(shù)據(jù)是基于機器學習的人工智能的一項常見任務(wù)。例如,來自 OpenAI 的 GPT-3可以預(yù)測句子中的缺失詞,甚至是段落中的缺失句子。許多基于人工智能的圖像處理系統(tǒng)已被用于通過智能預(yù)測原始圖像丟失的內(nèi)容來恢復視頻和圖像。
“從概念上講,研究人員可以使用類似的技術(shù)來確定藝術(shù)或工具或其他歷史人造文物的日期和起源,這些文物的潛在風格和技術(shù)會隨著時間的推移和原產(chǎn)地而發(fā)生變化,”昆頓說.
版權(quán)說明: 本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!
猜你喜歡:
- 2022-09-20 心境豁達恬淡的詩句有哪些呢(心境豁達恬淡的詩句有哪些)
- 2022-09-20 下雨前的征兆動物(下雨前動物有哪些征兆 – 糗問)
- 2022-09-20 便秘按摩哪里馬上見效快(便秘按摩哪里馬上見效)
- 2022-09-20 經(jīng)心的近義詞是什么呀(經(jīng)意的近義詞是什么呢)
- 2022-09-20 芡實怎么熬粥好吃(芡實和什么搭配熬粥好)
- 2022-09-20 0.44平方千米是多大(0.44平方千米有多大)
- 2022-09-20 北京奧運會會徽中國印是什么印(北京奧運會徽上中國印是什么)
- 2022-09-20 qq空間訪客數(shù)量是什么意思(QQ空間訪問量2000是什么概念)
最新文章:
- 2023-06-30 小龍蝦清洗怎么快又干凈(龍蝦怎么快速清洗 清洗龍蝦的方法)
- 2023-06-30 簡約現(xiàn)代的陽臺吊頂裝修用材料有哪些(休閑陽臺吊頂材料有哪些)
- 2023-06-30 蘑菇怎么清洗泥沙(蘑菇怎么清洗)
- 2023-06-30 王羲之的書法對聯(lián)(王羲之最美10幅對聯(lián))
- 2023-06-30 人類有信息素味道嗎(人類存在信息素嗎)
- 2023-06-30 對老師的感謝語20字(對老師的感謝語)
- 2023-06-30 食品安全知識內(nèi)容培訓(食品安全知識內(nèi)容)
- 2023-06-30 五一勞動節(jié)文案幽默(五一勞動節(jié)文案)
- 2023-06-30 合作共贏精彩語句八個字(簡短哀悼語八個字)
- 2023-06-30 中國的唐代建筑哪去了(中國唯一唐朝建筑)
- 2023-06-30 生死恨由京劇是主演(生死恨由誰主演京劇名家)
- 2023-06-30 了解戰(zhàn)國歷史看什么書(了解歷史看什么書)
- 2023-06-30 七創(chuàng)社出了哪些游戲(七創(chuàng)社還有什么動畫片)
- 2023-06-30 流浪地球講述的是什么故事(流浪地球講了什么故事)
- 2023-06-30 漂亮的主婦和健身教練是第幾集(漂亮主婦在家和教練是哪集)
- 2023-06-30 張仲景的傷寒雜病論并注明了什么(張仲景的傷寒雜病論并著述了什么)