9月18日,由鳳凰傳媒牽頭、江蘇人民出版社聯合同方知網數字科技有限公司共同打造的“抗戰(zhàn)史人工智能數據庫”在南京正式上線。
![]()
![]()
“抗戰(zhàn)史人工智能數據庫”依托大模型、知識圖譜、OCR 識別、語義理解等核心技術,將中國抗戰(zhàn)有關的圖書資源及期刊文獻進行一系列數字化加工、結構化標引、知識細粒度處理、內部資源管理、多元化應用服務、智能問答與可視化展示等處理,構建成集資源管理、學術研究、教育普及、展示傳播、智能服務于一體的“抗戰(zhàn)知識服務平臺”。
鳳凰出版?zhèn)髅郊瘓F黨委書記、董事長章朝陽在致辭中表示,運用現代科技手段,對浩如煙海的抗戰(zhàn)史料進行系統(tǒng)的、搶救性的數字化整合與開發(fā),打造一個權威、全面的資源平臺非常重要,“抗戰(zhàn)史人工智能數據庫”在搭建中一方面力求內容的權威性與系統(tǒng)性,另一方面注重技術的先進性與便捷性,此外,該數據庫還凸顯了教育的功能與時代性,引導讀者進一步深入學習和了解抗戰(zhàn)史。
同方知網數字科技有限公司總經理張宏偉表示,“抗戰(zhàn)史人工智能數據庫”是人工智能與出版深度融合的一次重要突破。它絕非簡單的史料數字化,而是以人工智能技術為核心,對海量歷史資源進行深度挖掘、智能關聯和知識重構的成果。它提升了歷史研究的效率與深度,拓展了歷史知識的傳播邊界。數據庫的上線發(fā)布,標志著抗戰(zhàn)史研究從傳統(tǒng)文獻檢索模式邁向問答式知識服務新范式。
江南大學原黨委書記、南京大學中華民國史研究中心主任朱慶葆從學術的角度談論該數據庫的價值所在,“我作為一名長期從事中華民國史,尤其是抗戰(zhàn)史研究和教學的工作者,深知史料是歷史理論的基石,是連接過去與未來的橋梁,抗戰(zhàn)史人工智能數據庫的建設回應了在新的時代條件下,歷史資源如何保存、如何發(fā)揮資政育人、啟迪未來作用的時代課題,這不僅是一個技術工程,更是一條承載深遠歷史意義和文化使命的工程?!?/p>
南京大學圖書館黨總支書記羅鈞同樣肯定了抗戰(zhàn)史人工智能數據庫的建設回應了時代的需求,“對珍貴史料利用數字化手段使其煥發(fā)新的生命力,服務于學術研究、社會教育和文化傳播是我們面臨的重要課題和時代機遇,抗戰(zhàn)史人工智能數據庫匯聚大量珍貴史料,不僅有效延長了文獻的生命周期,更是為學界和社會公眾構建了一個內容全面、結構清晰的抗戰(zhàn)史資料體系”。
南京市社科聯主席、黨組書記曹勁松從社科工作者的角度,認為抗戰(zhàn)史人工智能數據庫有助于促進人文經濟中知識庫價值鏈的拓展,“根據不同主題構建數字知識庫,既是人文經濟在滿足人們自身知識構建和精神成長的現實需求,又是文明發(fā)展在促進人類知識積累和探索創(chuàng)新的智慧驅動,成為數字時代人們從技術生存走向智慧生存的基礎性建設”。
![]()
![]()
抗戰(zhàn)史人工智能數據庫內容非常豐富,總文字體量超億字,其中不乏名著名作,包括《南京大屠殺史料集》《抗日戰(zhàn)爭專題研究叢書》《抗戰(zhàn)為什么贏》《抗戰(zhàn)旗幟毛澤東》等。其功能分成四個板塊,智能檢索板塊對史料進行數字化處理,利用數字化加工工具和AI工具對這些文本進行了語義分析、分類和索引,提取關鍵詞、主題,用向量空間模型,語義相似度計算等技術以自然語言形式生成回答。知識圖譜板塊利用先進的自然語言處理技術,從文獻等相關知識中獲得的大量抽取有價值的知識信息,識別出具有特定意義的實體,提供面向知識圖譜構建的智能化輔助。時間軸板塊將人物、事件、機構、地理的三元關系中的時間屬性進行梳理和標引,按照時間的演進,把重大歷史事件、歷史人物生平中涉及的各類實體和實體關系展示出來??箲?zhàn)搜問板塊為用戶提供智能問答服務,并從全文數據庫中提取知識片段,為用戶提供簡潔明了的答案,回答真實可信,并提供知識溯源、圖書溯源、相關文獻、推薦圖片、推薦問題、專題問答等服務,這是全國首個具有智能化功能的抗戰(zhàn)史數據庫。
未來,抗戰(zhàn)史人工智能數據庫將走進博物館、圖書館和各類學校中,為廣大用戶提供服務。
揚子晚報|紫牛新聞記者 沈昭
視頻|沈昭