PDF文字识别提取API接口免费调用

2023-06-12

数脉API

PDF文字识别提取API接口免费调用

一、接口名称:

PDF文字识别提取接口

二、接口介绍:

PDF文字识别提取API能根据上传的PDF文件,选取文档中需要提取的内容部分进行内容提取。

三、API接口文档

1、请求地址

https://api.shumaidata.com/v10/pdf/read

请求方式 method:post

参数:

2、签名算法说明:

服务商分配的appid、当前时间毫秒数timestamp、商户分配的app_security、 三者通过&符号拼接成字符串进行md5加密得到。


 如:appid=xyzxyzxyz,timestamp=1555378976238,app_security=efcefcefcefcefc ;

 拼接后的字符串格式:str = appid的值&amptimestamp的值&app_security的值;

 拼接后的字符串:str = xyzxyzxyz&1555378976238&efcefcefcefcefc ;

 加密后得到sign = md5(str) = 4e7e1974b79f3656aeaf03f1158f5d5d ;


3、正确返回:

{

   "msg": "成功",

   "success": true,

   "code": 200,

   "data": {

       "orderNo": "v6qkq4ytm52tpjxv3m",

       "ret_code": "0",

       "text": "杭州数脉科技有限公司 H a n g z h o u S h u m a i T e c h n o l o g y C o., L t d.2022年5月\n目录| CONTENTS 01 公司介绍 Company introduction  产品服务 Product service 02      荣誉资质 Honorary qualification 03  "    //识别内容

   }

}

4、错误返回:

{

   "msg": "参数错误",

   "success": false,

   "code": 400,

   "data": { }

}

5、返回字段说明:

6、code错误码说明