ChatGPT给新闻标题打分

前情提要

2019年的今天,用Egg.js + MongoDB等工具手搓了一个“慧语简报”服务,用于在页面中(或以JSON API的方式)生成一篇汇聚每日新闻12条 + 天气预报 + 历史上的今天等信息每日简报

由于简报中仅展示新闻的标题,爬虫抓取到的新闻标题各式各样,所以剔除低信息含量的新闻标题尤为重要。

总结“烂新闻标题”的特征,写了近百个正则,用于在入库前清洗掉那些不重要的新闻标题。
举几个例子:/吗?$/, /这个/, /为什么/, /一文读懂/, /《某皇帝名字/
这些正则经过不断补充完善,剔除无用新闻标题的效果拔群,但始终无法解决的问题是如何用程序找出头条新闻,如何按重要程度排序新闻……

ChatGPT

直到ChatGPT的API能够以白菜价调用,新闻重要性评分的问题得以解决。感叹AI进化的速度如此之快,可以毫不犹豫的给一众新闻标题打分,甚至有理有据令人信服,即使偶尔略微有失偏颇也难掩它的优秀。

输入:
input

输出:
output

模型是GPT-4o,以“小样本学习”的prompt向大模型解释我的评分标准,让它在相同的评分标准下给不同的新闻标题进行打分

通过调整prompt,可以输出更精简的id和分数信息,省略评分原因,给8个新闻打分的开销低于$0.005,成本可控。

我会持续优化它,让这个刀耕火种的单体应用得到AI附魔,就像给蒙多安装一套海克斯科技义肢,想想就很赛博朋克。

WildCard

由于服务器在国内无法直接调用OpenAI,借助了WildCard的“随心用”服务,也是预先充值,按量计费扣除。

这里有一个WildCard的介绍视频

如果你也想试试,可以用我的邀请链接注册,开卡费用减1美金: https://bewildcard.com/i/ICHEER
或者在注册时填写邀请码:ICHEER

无关分享

技术圆桌,近几年一直订阅着的一个博客,持续输出高质量文章 https://v2think.com/

Buy me a coffee ☕