V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  newphper  ›  全部回复第 1 页 / 共 1 页
回复总数  1
2019-11-08 14:21:51 +08:00
回复了 lemonada 创建的主题 程序员 关于如何计算每日新闻的热点
我也在做这个,我现在具备给每一条新闻计算实时热度的能力。
我是计算新闻实时热度,全是自己算的,不需要微博热搜,百度指数等参考。
分词只是其中一小部分,词和词之间的权重是不一样的,比如坠机和公司,两个词的重量就不一样。
还有新闻相似度计算,这个才是重要的。同样的热点新闻,多的时间快两百家媒体报道。
我业余做这个已经做了一年多了,你可以看看我的产出

微博:《今日主流热点》 https://weibo.com/u/6926438705 (每小时定时发送本小时计算出来最热的新闻, 还有突发热点,实时误差 15 分钟)
公众号:《今日主流热点》(麻烦自己搜了)(每天总结当天最热的 25 条热点)
每条热点都能计算到有多少新闻源报道,每小时的热度趋势变化。

你可以先抓微博的,微博的比较短。新闻媒体的话抓几家有新闻采编权的主流媒体就行了,大部分都是抄来抄去的。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5047 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 07:41 · PVG 15:41 · LAX 23:41 · JFK 02:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.