本文共 1894 字,大约阅读时间需要 6 分钟。
英国著名体育媒体GiveMeSport算是新兴技术的应用先行者。其创立于2011年,主要基于Facebook专业发布与体育相关的新闻、专栏文章等。目前,其成功借助专有技术在Facebook上吸纳了2500万以上的订阅用户。2016年10月,GiveMeSport 被 Breaking Data Corp.(国外一家人工智能技术提供商)收购,利用该公司的AI技术,其成功立于一众竞争者之前列。
雷锋网(公众号:雷锋网)了解到,GiveMeSport已在新闻频道的两个终端应用了AI技术,包括分析和反应片段以及重大新闻的报道。在此之前,该新闻机构每个月产出的2000篇文章,绝大多数来自14位全职以及50位自由撰稿人的工作成果,他们撰写的文章就是反应片段。
据报道,这一新项目大大释放了作者们的时间,使其有更多的精力专注于1500字以上的文章的撰写当中,同时这类文章也能争取到更多的广告投放空间。
“全球有很多有潜力的AI团队”,Breaking Data的CEO Nick Thain如此表示,其在2016年底收购了GiveMeSport,“现在Breaking Data正在尝试从理解社交媒体语言,本土语言及其缩写,以及语言在适应过程中是如何改变的等等来分离公司重点。”
以下就是该新闻机构利用AI在新闻报道中的具体应用:
新闻采集和事件识别
通过自然语言处理(NLP),Breaking Data的AI技术能够实现对Twitter的秒级扫描,并通过预定关键词,如足球队、球员名字、球队名称、俱乐部、联赛、比赛场地等等,来筛选相关内容。这些内容在经过过滤和验证之后,会被分类为“重大事件”、“相关新闻”或者“夸张新闻”,然后在BreakingSports Slack频道里会被作为警报发送给记者,再由通知里的编辑团队首要处理。
在这个过程中,GiveMeSport使用了Breaking Data的AI技术,可将各个公开的数据源,如Facebook、Reddit、维基百科等等,汇集在一起。
图片来源:Digiday
尽管已有大量可用的社交工具, 但是Thain 解释到,该平台还能通过识别可靠、可信的信源来突出有可能不太准确和真实的推文。举个例子,假如有消息称,足球队员Neymar 将以2.22亿欧元(约合2.61亿美元)的高价加盟巴黎圣日耳曼队,GiveMeSport的AI平台会即时追踪该新闻首次出现在Twitter上的时间,并将该账户标记为可信权限。
随着该AI平台对语言的了解逐渐深入,它还能识别出特定领域的规范偏差。Thain表示,该平台可以捕捉住一个足球场半径范围在一英里的所有推文。假如跟踪一位发推频次非常规律的物理治疗师(其很有可能是为运动员提供诊疗服务的),在经过一天繁重的工作之后,该诊疗师可能会连续发出几条抱怨工作负载的推文。发推频次和内容主题的变化,将被机器捕捉并予以标记,从而将其作为警报发送给该新闻机构Slack频道的记者。记者们即可联系相关俱乐部,调查是否有运动员受伤等事宜。
管理Facebook平台的内容分发
Facebook是GiveMeSport 最大的推送平台。该新闻发行商的记者也会在Facebook上发布帖子,并为其文章取标题等。雷锋网了解到,GiveMeSport还将该AI技术嵌入到内容管理系统中,并根据文章帖子对点击率和参与度的贡献来为每位作者打分。
此外,该技术还分析了文章的词语组合、句子结构和形象,从而和受众产生共鸣。
“(事实上)它和识别标题里的大写字母一样简单,可识别出Facebook用户可能会厌倦的内容。或者,它还能确定曼联球迷不喜欢被称作「MU 」或者「红魔」。”Thain表示,“该技术支持作者以其熟练的技法来写作。”
“内容分发应该是科学的,我们不想错过这个机会。AI给了我们超越其他竞争对手的优势。”Thain补充道。
为内容赋予感情
据了解,现阶段GiveMeSport的作者在处理每个故事的「感情」标签时,仍依赖于手动操作。这些情绪会有一个预定的数据库,如快乐、悲伤等30种以上的情感,作者们根据自身满足的情感奖励组织内容,标记每个故事。后续借助AI技术,该平台可对历史数据集进行类似分析。这一过程运行的理论为,通过理解更深层次的情感,从而可以预测内容的表现,来链接用户。
“体育一定是关乎情感的,”Thain说,“它归结于你对某件事的感觉,或者归结于你想告诉其他人你刚读过的文章的感觉。吸引用户想读的内容,无非就是不可错过的,或者就是和你相关经历有关的。”