数脉API 文本违禁词审核接口调用

2026-01-29

数脉API

数脉API 文本违禁词审核接口调用

一、接口名称

文本违禁词审核接口

 

二、接口介绍

文本违禁词审核接口,传入文本,对文本内容进行自动审核,是否存在违禁词、敏感词,并返回违规详细原因,多维度过滤审核不合规内容,支持自定义违规内容。

 

三、API接口文档

1. 请求地址

url:https://api.shumaidata.com/v4/text_censor/censor

请求方式 method:GET

参数:

 

2. 签名算法说明

服务商分配的appid、当前时间毫秒数timestamp、商户分配的app_security、 三者通过&符号拼接成字符串进行md5加密得到。

 如:appid=xyzxyzxyz,timestamp=1555378976238,app_security=efcefcefcefcefc ;

 拼接后的字符串:str=xyzxyzxyz&1555378976238&efcefcefcefcefc ;

 加密后得到sign = md5(str) = 4e7e1974b79f3656aeaf03f1158f5d5d ;

 

3. 正确返回示例

// 合规返回

{

    "msg": "成功",

    "success": true,

    "code": 200,

    "data": {

        "orderNo": "452639715694757278",

        "conclusion": "合规",

        "conclusionType": 1,

        "details": null

    }

}

// 不合规返回

{

    "msg": "成功",

    "success": true,

    "code": 200,

    "data": {

        "orderNo": 15656780617612718,

        "conclusion": "不合规", // 审核结果,可取值:合规、不合规、疑似、审核失败

        "conclusionType": 2, // 审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败

        "details": [ //不合规/疑似/命中白名单项详细信息。响应成功并且conclusion为疑似或不合规或命中白名单时才返回,响应失败或conclusion为合规且未命中白名单时不返回。

            {

                "type": 11,//审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单

                "subType": 0,//审核子类型,此字段需参照type主类型字段决定其含义:当type=11时subType取值含义:0:百度官方默认违禁词库;当type=12时subType取值含义:0:低质灌水、2:文本色情、4:恶意推广、5:低俗辱骂、7:隐私信息;当type=13时subType取值含义:0:自定义文本黑名单;当type=14时subType取值含义:0:自定义文本白名单

                "conclusion": "不合规", // 审核结果,可取值:合规、不合规、疑似、审核失败

                "conclusionType": 2,// 审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败

                "msg": "存在百度官方默认违禁词库不合规",//不合规项描述信息

                "hits": [//送检文本违规原因的详细信息

                    {

                        "datasetName": "百度默认违禁词库",//违规项目所属数据集名称

                        "words": [//送检文本命中词库的关键词(备注:建议参考新字段“wordHitPositions”,包含信息更丰富:关键词以及对应的位置及标签信息)

                            "免费●●"

                        ]

                    }

                ]

            },

            {

                "type": 12,//审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单

                "subType": 3,//审核子类型,此字段需参照type主类型字段决定其含义:当type=11时subType取值含义:0:百度官方默认违禁词库;当type=12时subType取值含义:0:低质灌水、2:文本色情、4:恶意推广、5:低俗辱骂、7:隐私信息;当type=13时subType取值含义:0:自定义文本黑名单;当type=14时subType取值含义:0:自定义文本白名单

                "conclusion": "不合规",// 审核结果,可取值:合规、不合规、疑似、审核失败

                "conclusionType": 2,// 审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败

                "msg": "存在文本色情不合规",//不合规项描述信息

                "hits": [//送检文本违规原因的详细信息

                    {

                        "modelHitPositions": [//送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。

                            [

                                0,

                                6,

                                0.9998

                            ]

                        ],

                        "wordHitPositions": [//送检文本命中词库的详细信息,为Object的列表,包含words、positions、label三个字段,详细描述如下表所示。

                            {

                                "keyword": "找小姐",//送检文本命中词库的关键词

                                "positions": [//关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置”

                                    [

                                        0,

                                        2

                                    ]

                                ],

                                "label": "200602"//关键词命中的细分标签,标签规则见文末“细分标签对照表”

                            }

                        ],

                        "probability": "1.0",//不合规项置信度

                        "datasetName": "百度默认文本反作弊库",//违规项目所属数据集名称

                        "words": [//送检文本命中词库的关键词(备注:建议参考新字段“wordHitPositions”,包含信息更丰富:关键词以及对应的位置及标签信息)

                            "找小姐"

                        ]

                    }

                ]

            }

        ]

    }

}

label 字段细分标签label字段描述:

结果         说明

100100 恐怖描述

100200 毒品违禁药

100300 武器描述

100400 赌博及高利贷

100500 儿童恐怖影视

100600 造假&非法培训

100700 ●●外挂服务

100800 代孕&人口买卖

100900 个人信息贩卖

101000 诈骗

101100 保护动物

109900 其它违禁相关

200100 性行为描述

200200 未成年色情

200300 性器官描述

200400 畸恋描述

200500 色情资源

200600 性挑逗/暗示

200700 色情交友

200800 色情道具

200900 色情段子&舆情

209900 其他色情相关

400100 联系方式

400200 关注引流

400300 兼职代理

400400 产品推广

400500 企业推广

400600 广告法

400990 其他恶意推广

500100 轻度辱骂

500200 重度辱骂

 

4. 错误返回示例

{

    "msg": "文本不能为空",

    "success": false,

    "code": 400,

    "data": null

}

 

5. 返回字段说明

 

6. Code错误码说明

 

四、适用场景

 

适用于社交平台、内容平台、电商平台、在线教育平台、游戏平台、直播平台、广告平台、生成式人工智能应用等各类涉及文本内容的场景。

 

五、相关接口推荐

图片审核接口

 

更多API接口调用:https://www.shumaiapi.com/product