中文数据库

识典古籍

来源:图书馆     [发布者:admin]     [发布时间:2022年11月09日 10:27]     [点击率:651]

访问地址:https://www.shidianguji.com/

数据库简介:
    识典古籍是“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台,目前,该平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,面向公众免费开放。未来三年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录。
    该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。文字识别技术,是对古籍的影印版文字进行单个切分,再进行文字识别和顺序识别。自动标点技术,是通过序列标注的方式对古籍自动进行标点划分。命名实体识别技术,则是通过序列标注识别文本中的人名、地名、书籍、时间、官职等信息。据悉,目前行业内OCR识别准确率平均为93%至94%,“识典古籍”的准确率为96%至97%。
    与其他古籍数字化平台相比,“识典古籍”具有自身的特点,页面简洁,浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,便于专业研究人员、广大古籍爱好者使用。同时,“识典古籍”书目将持续更新,后续将上线手机移动版。
使用方法:页面浏览直接使用。咨询电话:62158482。


维权声明 : ©2017 中国 合肥 合肥学院图书馆

电话:0551-62158485 邮编:230601

COPYRIGHT 2017 HEFEI UNIVERSITY LIBRARY

DESIGNED FOR MICROSOFT IE 9.0+/1920*1080

您是第3136742位访问者