请先关注慧科讯业公众号
最新动态
DeepSeek赋能迭代:慧科讯业凭借AI+社交大数据技术重构行业领跑边界
发布时间:2025-03-17 17:44:13

作为社交大数据领域领跑行业发展的人工智能技术公司,慧科讯业基于累积多年的AI技术实力与27年丰富客户服务经验,落地于AI驱动的知识图谱技术提升数据价值和效率,实现AI在营销中的实战应用,充分释放商业价值。


背靠拥有100+ AI及大数据专家的Wisers AI Lab,立足于自研四大模型和三大独有AI技术,慧科讯业自研的行业权威媒介大数据挖掘分析模型(Wisers Industry LLM)在数据处理和分析的全面性、准确性、时效性等方面都在业界遥遥领先。准确率引领行业最高标准,可对标Deepseek R1 Level;性能优势显著,处理每个调用平均时长仅为通用LLM的1/20。在稳定性方面,实现更高并发和高性能的同时,慧科讯业已基于火山引擎和华为云上的DeepSeek,使用双活LLM及自有蒸馏行业化模型(2+1)的模式规模化服务客户,实现更准确、速度快、情感准的行业化应用,赋能客户最大化挖掘和商用社交媒体数据价值。




人工智能时代,数据和技术已成为驱动社会进步、经济增长、企业发展的核心要素。尤其在人工智能与数字化深入融合的今天,社交数据已经成为驱动企业管理、商业创新、激发增长等方面的重要因素。社交数据以体量庞大、平台及形式丰富、语义及场景繁杂等特点,在数据的采集、处理、分析及洞察等商业应用方面都带来了极高的挑战。


作为3年前ChatGPT的最早期应用者,慧科讯业(Wisers)也是国内最早将DeepSeek进行商业应用的技术公司,比业界提前8个月实现全面集成DeepSeek。在2024年初借助早期版DeepSeek的开源技术孵化蒸馏了自己的行业化模型,并开始规模化商用。2024年第二季度,慧科讯业作为DeepSeek早期用量最大的客户,曾突破当时DeepSeek底层基础设施资源瓶颈和服务不稳定、性能不高等挑战,成功沉淀出一套慧科讯业独有的,对日均百亿Token数据进行结构化的Wisers LLM及其构建系统、运营系统和机制。Wisers LLM 无论在精准度、处理成本、还是数据处理量级方面对比DeepSeek都得到显著的优化和提效。




慧科讯业作为全球舆情大数据智能分析和商业应用领导者,多年累计服务超3000家客户及十余年AI技术经验总结,目前,社交大数据商业应用主要面对以下四大核心挑战:

1

海量数据挖掘:如何确保数据的全面性、准确性和实时性?


2

数据结构化处理:大量社媒数据为文本、视频、图片、音频等多模态数据,如何对非结构化内容进行结构化处理?


3

行业化挖掘信息:如何基于行业场景和具体商业需求,精准地识别和抽取关键数据信息?


4


商业洞察应用:如何借助社交数据,全面、准确、完整地进行数据分析和洞察,服务于商业应用?



慧科讯业AI大模型为什么能高效应对四大核心挑战?


2014年,慧科讯业AI Lab 技术实验室成立,专注中文语义AI技术的发展与创新。十余年来,慧科讯业不断应用AI技术提升数据价值和效率,并通过技术+专业分析师人机结合的方式,满足行业顶级客户严苛需求。


近年来,随着ChatGPT、DeepSeek等大模型接连问世,掀起行业革命,舆情服务商陆续宣称接入各种大模型。作为营销领域最早开始应用AI的公司,慧科讯业早已将大模型融合至技术及业务中,用于训练慧科讯业自研大模型及小模型。基于训练模型经验,结合慧科讯业27年沉淀的深厚行业knowhow和服务经验,助力品牌营销洞察决策。


目前,行业内常见的主流应用方式是接入ChatGPT、DeepSeek等大模型官方API,直接面向客户端应用。慧科讯业经过迭代升级,已基于火山引擎和华为云上的DeepSeek,用双活LLM及自有蒸馏行业化模型(2+1)的模式规模化服务客户,在稳定实现更高并发和高性能的同时,为行业提供更准确、速度快、情感准的行业化应用。


与此同时,慧科讯业采用业界领先的三大技术,从海量文本数据中进行高效且成本可控的数据挖掘及结构化处理,同时精准识别关联主体,准确实现热点话题、新兴趋势及商业洞察挖掘,打造数据应用完整技术闭环,有效解决行业核心挑战。


慧科讯业话题发现与追踪模型(WTDT)技术:通过AI驱动的智能话题发现技术,结合独创的无监督模型与LLM融合算法,在行业强关联技术支持下实现百亿级数据中热点及新兴趋势的秒级捕捉与异常洞察,确保话题挖掘的高精准度。


慧科讯业主体与维度抽取模型(WSAE)技术:基于混合模型架构,能够自动抽取话题关联主体并归一化不同表述的别称,在多主体场景中精准识别话题与实体关系,同时实现实体、观点类别、属性维度及话题 - 实体关系的联合抽取。


慧科讯业基于维度的情感分析模型(WABSA)技术:依托混合模型技术,通过多粒度层次化分析框架实现属性维度层级的细粒度情感识别,并整合主贴与评论信息构建观点与话题主体的精准关联映射。



慧科讯业自研大模型如何助力企业解决舆情核心挑战?


慧科讯业自研媒介大数据挖掘分析模型(Wisers Industry LLM)包含意图识别模型、水军去废模型、知识图谱模型与增强分析模型四大类型。四大模型覆盖大数据挖掘分析全过程,赋能大数据应用完整链路,协同实现从智能采集、数据净化、语义理解到决策支持的全流程自动化,帮助企业快速捕捉热点、识别风险、优化策略。


意图识别模型,提升数据采集准确率:慧科讯业自研意图识别模型,能实现自学习、实时更新采集规则,可将传统需数月的人工任务缩短至小时级,实现95%以上准确率的7×24小时实时社交媒体数据采集,每日处理千万+有效文章。


水军去废模型,提升水军识别率:基于原有水军模型的行业化迭代升级,从“机器粉”账号识别,再到通过水军个体行为、内容、互动的表现识别,逐渐积累行业水军群体特征。


知识图谱模型,提升敏捷度与实时性:慧科讯业自主研发100+AI算法及模型,全面赋能各业务应用场景。借助慧科讯业自研知识图谱,自动构建和抽取模型,可实现2天内从0到100构建含数千个主体维度标签的行业知识图谱,构建效率提升百倍。


增强分析模型,发现有价值的洞察:自动分析数据找问题,比如销量突然下降时,能关联到社交媒体上的负面评价,生成带图表的分析报告。还能看懂图片视频里的信息,比如识别广告中的品牌LOGO和促销信息。


立足于四大模型和三大技术,慧科讯业自研媒介大数据挖掘分析模型(Wisers Industry LLM)效果及效率方面在业界遥遥领先。其准确率高,可对标Deepseek R1 Level,同为行业最高水平;同时性能优势显著,反应更加敏捷,处理每个调用平均时长仅为通用LLM的1/20。




慧科讯业 AI 大模型及知识图谱技术深度应用主流营销场景,充分释放AI商业价值


在商业价值驱动方面,慧科讯业 AI大模型技术通过高效的四元组关系识别技术,实现知识图谱自动构建和抽取模型,可准确识别文本中主体-维度-观点/话题-情感的四元组关系,实现结构化处理。


此外,相比传统人工知识图谱构建和打标中遇到的覆盖低、耗时久、不精准、难洞察等问题,慧科讯业知识图谱能自动构建和抽取模型,结合虚拟知识图谱(Virtual Knowledge Graph, VKG),将传统需数月的人工任务缩短至小时级,实现95%以上准确率的7×24小时实时社交媒体数据采集,每日处理千万+有效文章。


同时,行业专有大语言模型LLM支持跨行业的细粒度多种类维度属性抽取,精准实现内容、语义、场景的分析;借助Wisers AI LAB的专业实验数据,能够支撑实际应用20多种艺术字体可识,支持广告KV素材训练和识别等AI图像识别技术,帮助品牌捕捉更多信息曝光,挖掘更多内容营销点。


营销场景一:负面危机舆情监测追踪

负面危机舆情监测对时效性和准确度要求高,针对目前行业内常见的主体识别不清、情感判断不准等痛点,慧科讯业采用智能自学习引擎、360度情感判断模型、正负话题/事件发现模型、行业化多维负面分类模型,预警时效远优于业界水平,预警漏报率缩减至业界水平1/20,成本仅为业界平均30%,为用户带来了更加智能高效的舆情分析体验。




营销场景二:营销活动策划和效果分析

营销活动策划和效果分析需要投入大量时间和数据训练合适的模型,并且需要大量人工处理,费时费力;如借助深度学习模型或一般大模型,则会产生耗时及高额成本问题。慧科讯业基于自有活动发现模型及话题发现模型,精细化6级维度进行打标,同时提效最高30倍。



营销场景三:产品力评估和产品创新

产品力评估和产品创新中,需要结合大小数据,及时发现竞品动作的同时,前瞻消费者喜好趋势。传统的产品力评估和创新模式下,会面临小样本数据偏差风险,海量大数据信息庞杂、人工介入成本高、耗时长。慧科讯业依靠全量社媒及电商数据,结合自有主体识别、维度识别技术及新品发现模型,可大大提升数据处理速度及效率,将打标成本降至业界1/50。



随着AI技术的不断演进和社交数据的持续增长,慧科讯业将秉承全面拥抱AI、深耕技术创新的使命,继续推动AI与商业应用的深度融合与实践。


未来,慧科讯业将继续借助LLM、Agent等领先技术,持续革新业务流程及技术方案,不断带来更高效、更优质、更多客户价值的产品及服务,为客户提供覆盖营销全链路综合分析及数据应用的数字化解决方案,助力客户在人工智能与大数据深度融合的时代抢占先机。