评论现状梳理
2016-09-28 19:06:09 0 举报
AI智能生成
在当前的评论现状中,我们可以观察到几个主要特点。首先,随着互联网的普及和社交媒体的发展,评论已经成为了人们表达观点、交流思想的重要渠道。其次,评论的内容和形式呈现出多样化的趋势,既有对热点事件的讨论,也有对个人生活感悟的分享。然而,这也导致了评论质量参差不齐的问题,一些恶意攻击、人身攻击等不良现象时有发生。此外,评论的互动性也日益增强,用户之间的讨论和争论成为了评论的重要组成部分。总体来说,评论现状呈现出多元化、互动性强的特点,但同时也面临着质量把控和秩序维护的挑战。
作者其他创作
大纲/内容
评论策略
竞品爬取
现状
规则:对PC站的文章,标题完全相同的两篇文章才会爬取
数据:自产评论:爬取评论=5:1(数据不稳定,待十一后输出准确数据)
来源:头条、凤凰、新浪新闻、网易
问题:网易/头条评论很多,为什么爬来的这么少
改进
增加微博爬取
适用范围:微博热点热搜TOP 20
爬取规则:1.对搜索结果中【精选】微博第一条下的评论进行爬取;2.爬取时过滤:微博,新浪,渣浪,@XXX等关键词;
分发:评论优先应用给该事件相关文章中展示数最高文章/分发至多篇文章
考虑按照标题/正文相关性进行爬取(优先用于客户端内热搜等热门事件)
客户端内文章聚类
聚合准确度:按目前规则,聚在一起的文章相近度在90%以上(需进一步评估)
分发逻辑:聚在一起的N篇文章,对于同一个用户只会分发一篇
搜索展示:搜索结果可以实现对同一类文章只展示一篇
评论数fake逻辑
目前逻辑:100时才开始fake,自媒体文章不fake
问题:赞踩数和评论数不匹配
0 条评论
回复 删除
下一页