信息披露报告实体识别与关系抽取点击体验
基于自然语言处理技术,对上市公众公司信息披露报告中的大短文本进行知识提取,做到信息披露文件的数据结构化、智能化。对信息披露报告内容,利用句法分析、关系抽取、实体挖掘等技术,通过模型训练在特定文本章节获取垂直领域知识。
产品特点

XBRL格式数据处理

XBRL(可扩展商业报告语言)是基于互联网、跨平台操作,专门用于财务报告编制、披露和使用的计算机语言,基本实现数据的集成与最大化利用。

专业领域词库扩展

扩展自然语言的知识库,其中包括词库扩展及词性、词类训练等,提升NLP在特定领域的智能化程度。

机器学习

利用信息披露规则,有效处理报告中的不完全规律性数据与组合,根据实例文档真实数据的实体标识资料训练出专有特征的知识库,训练的场景越多,召回率越高。