人工智能审核系统的其中一个重要的工作内容,即通过文本识别技术对新闻内容中疑似违规的内容进行标注、过滤和召回,较为明显的错误内容则进行过滤和下架,也可以将一些疑似的错误失范内容进行标注,半岛bd体育辅助人工审核团队进行判断,主要流程分两部分:
文本识别技术主要是以人工智能算法为基础,由新闻内容平台的运营和审核人员持续更新关键词库,针对相关的违规内容进行关键词的录入,并通过算法技术进行持续训练,以提髙机器判定的准确性。
该过程在新闻生产者发布上传内容后由人工智能文本识别即刻进行。当标题或正文中出现违规关键词或者基本的语义用词错误,机器算法会对其进行打分,打分超过一定阈值,会对出现错误或违规的地方进行不同颜色的标注。
内容识别,即在新闻内容发布前和发布后通过风险模型对新闻内容进行监控和过滤,主要依据鉴黄模型、谩骂模型、低俗模型、泛低质模型等技术对新闻内容中可能存在的失范问题进行审核把关。
与机器人文本识别技术不同的是,风险内容识别不仅基于对新闻内容本身的分析和判断,更包括对新闻内容传播后用户的反馈,并根据后续消费者的一系列行为数据进行判断。半岛bd体育
人工智能审核技术可以对平台每天新生产的数百万的新闻内容进行基本的判断和识别,保证所有的新闻内容都经过审核流程。如果人工智能审核技术并未发现新闻内容存在失范、违规行为,且发布新闻的账号等级权益较高、过往无违规历史,则该条新闻内容可跳过人工审核阶段,直接被聚合新闻平台发布。
这样的好处是减少了新闻内容的积压,保证新闻内容可以被快速的发布传播,且降低了人工审核的成本和压力。
另一方面,人工智能审核系统可以显著提高原人工审核新闻内容的效率。人工智能审核利用机器人文本识别技术和风险内容识别模型,可以将新闻内容中疑似存在违规的部分进行不同颜色、不同形式的标注,这样在人工审核的同时,不必完全对新闻内容进行从头到尾的浏览,只需对算法标注的部分进行审核判断即可,这样可以极大提高审核从业者每天审核新闻内容的数量。
这其中效率的提升虽然有审核组织和管理者不断简化审核流程的因素存在,但人工智能审核技术的发展才是最为核心的部分。
正如之前提到的半岛bd体育,风险内容识别不仅在新闻内容发布前会对新闻内容进行判断,更会在新闻内容发布后对新闻内容进行实时监控。国内用户量极大的新闻内容生产平台自身系统曾存在漏洞,即新闻在经过审核发布后,新闻生产者仍然有权对新闻内容进行编辑修改。
导致了原本经人工审核判断没有违规的新闻内容,新闻生产者在新闻发布后进行二次编辑,成为了可以攻击国家和政府的存在政治风险的新闻内容,给平台本身带来了恶劣影响并被国家网信办要求停业整顿。
因此,新闻内容生产平台需要通过风险内容识别技术,在新闻内容传播过程中对新闻受众的反馈进行实时监控,以对违规的新闻内容进行下架半岛bd体育、违规言论进行删除、低质内容进行打压降权的方式保证新闻内容在审核发布后仍在合规合法范围内。更多详情返回搜狐,查看更多