您好,欢迎访问华文智讯(北京)科技有限公司官网!

服务热线:18001150095

PDF反解制作软件

发布日期:2023-09-14

1

华文智讯公司反解标引软件是自主研发的“知识生产服务平台”的重要组件之一,全称为“华文智讯反解标引软件”。该产品可以直接解析PDF版式文件,对报纸、图书、杂志、年鉴、内刊、汇编等内容智能标引,知识关联,并将非结构化的数据生产为结构化的XML文件数据。

标注反解支持字段包括:库名、报名、期号、出版日期、当日版面数、版次、版名、版条、版面缩略图、版面尺寸、栏目、版面缩略图、版面尺寸、标题、引题、标题、副题、地区、人物、分类、作者、文章来源、文章字数、图片作者、图片数量、图片说明、告关键词、广告面积、广告类型、广告色彩、正文、坐标等。

image

image

主要功能描述

1.稿件关联功能:支持多个文字块、图文、表格以及其他块之间的关联,支持版面块多层次间的嵌套关联关系。

2.信息标引功能:系统支持对版面信息、文章信息、图片信息等相关标引项的信息反解和标引。

3.内容反解功能:系统能够非常准确地从版面中提取稿件内容,包括从版面的文本块中提取文字内容。

4.信息加工功能:系统提供了对版面文章的内容加工修改的功能,包括对文章内容的预览和修改、选中标引块转换为图片等功能。

5.多次标引的功能:对一个版面的标引可以进行多次,下次打开标引的时候能够记住上次标引的结果。

6.图片处理功能:标引系统能够按照设置,自动对版面中的稿件附图进行处理,包括把tif、EPS等格式的图片转化为jpg图的格式转化功能、把适合于报纸印刷的高精度图片转化为低精度的适合于网上发布的图片精度转化功能,以及把大幅面的图片转化为小尺寸的图片的尺寸转化功能等。

7.系统提供广告类型的分类以及对广告的处理,能够针对不同的广告类别提供不同稿件图设置。

8.配置管理功能:为方面用户的操作,提高系统的灵活性,系统提供了很多选项供用户设置。

9.选中版面块生成稿件图功能:一篇复杂的稿件在有些情况下转换成图片是非常有用的,如在互联网发布广告、表格等时该功能就显得非常关键。

10.提供对“标题”、“作者” “期号”等字段自动提取的支持。

_________________________

华文智讯公司数智化服务业务

1.数智服务:书报刊扫描、电子报刊制作、电子宣传品制作、各种精度文本加工、数据标注、数据挖掘、软件开发、系统设计等服务;

2.数据加工:图书、报纸、期刊、古籍、杂志、电子数据、网上资源等各类资源;

3.系统建设:数据库系统、检索系统、分类、著录、知识图谱等不同用途的系统;

4.业务对接:18001150095(同微信)胡经理,期待与您真诚合作。


分享到: