(一)数据编码
EP-TXTO-10-AB
(二)数据名称
欧洲专利全文文本数据
英文、法文、德文
(四)更新周期
每周更新
(五)数据内容及格式
数据内容:包括著录项目、摘要、权利要求、说明书、说明书附图。
数据格式:
(六)文件结构
1. 概述
本数据的文件结构包括三层文件夹,实体数据存储在第三层文件夹下。 第一层文件夹:数据编码与数据名称。数据编码由国别代码(两位大写字母)+文献内容代码(三位大写字母)+文献内容属性代码(一位大写字母)+专利类型代码+文献种类代码组成;数据名称为数据中文全称,例如:CN-BIBO-10-A_中国发明专利申请公布著录项目数据。 第二层文件夹:数据发布年代,4位数字,YYYY(4位年),例如2014。
第三层文件夹:数据发布期号,为三位流水号,每年从001开始。
2. 相关代码说明
文献内容代码说明:
BIB:著录项目数据
ABS:摘要数据
TXT:全文文本
IMG:全文图像
文献内容属性代码说明:
O:表示原始数据
T:表示翻译数据
专利类型代码说明:
10:发明专利
20:实用新型
30:外观设计
文献种类代码说明:
A发明专利申请
B发明专利授权
U实用新型专利授权(韩国为实用新型专利申请)
Y实用新型专利授权(日本2000年以前,中国1993-2010年4月及韩国为实用新型专利授权)
S外观设计专利授权
(七)数据说明
1.XEPA压缩包数据路径
例如:
XEPA2014008.zip\XEPB2014008\DOC\EPNWA1\000\000\002\799\965\l
路径说明:
XEP+文献类型(1位大写字母)+4位公布年+3位期号.zip
\XEP+文献类型(1位大写字母)+4位公布年+3位期号
\国别代码+NW或W1+文献类型
\补3位0
\补3位0
\补2位0+公开号第1位数字
\公开号第2-4位数字
\公开号第5-7位数字
\l
最底层文件夹内含有:
1个代码化文件“l”
1个全文说明书图像“DOCUMENT.PDF”
摘要附图[0个或1个“imgafNNN.tif”]
切图[0个或多个“imgbNNNN.tif”]
说明书附图[0个或多个“imgfNNNN.tif”]
检索报告页[0个或多个“srepNNNN.tif”]
2.XEPB压缩包数据路径
除文献类型改变外其他路径信息与XEPA压缩包一致。
3.DTDS文件夹:存放数据标准DTD文件
4.主要数据元素