开yun体育官网入口登录app"> 开yun体育官网入口登录app,这是一个为宠物爱好者打造的平台,提供全面的宠物护理知识、训练技巧以及宠物产品推荐。在这里,您可以与全球的宠物主人交流经验,分享爱宠的点滴生活。无论是初次养宠物,还是经验丰富的主人,您都能在这里找到有用的资源《开yun体育官网入口登录app》一款健康管理软件,是身体状况记录和管理软件,与智能设备连接使用,用户可以随时在上面添加设备,可以在手机app上面查看运动步数、血压、血脂等健康数据。律云健康app最新版会根据数据显示制定个性化的健康指导,让用户能够便捷分析,检测自己身体的各项指标,实时掌握自己的心率、步数以及血压等数据,发生什么异常情况可以及时的知道!欢迎大家下载律云健康app安卓版使用!。️">
🍇第一步:🍭访问开yun体育官网入口登录app官方网站或可靠的软件下载平台:访问(http://xzczwl.cn/)确保您从官方网站或者其他可信的软件下载网站获取软件,这可以避免下载到恶意软件。
🍇第二步:🥇选择软件版本:根据您的操作系统(如Windows、Mac、Linux)选择合适的软件版本。有时候还需要根据系统的位数(32位或64位)来选择开yun体育官网入口登录app。
🍇第三步:⚓️下载开yun体育官网入口登录app软件:点击下载链接或按钮开始下载。根据您的浏览器设置,可能会询问您保存位置。
🍇第四步:💦检查并安装软件:
在安装前,您可以使用杀毒软件对下载的文件进行扫描,确保开yun体育官网入口登录app软件安全无恶意代码。
双击下载的安装文件开始安装过程。根据提示完成安装步骤,这可能包括接受许可协议、选择安装位置、配置安装选项等。
🍇第五步:⛩启动软件:安装完成后,通常会在桌面或开始菜单创建软件快捷方式,点击即可启动使用开yun体育官网入口登录app软件。
🍇第六步:🏔更新和激活(如果需要): 第一次启动开yun体育官网入口登录app软件时,可能需要联网激活或注册。
检查是否有可用的软件更新,以确保使用的是最新版本,这有助于修复已知的错误和提高软件性能。
🗼欢迎使用🔥【开yun体育官网入口登录app】🍇🎯️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)创建于2005年,最初只是一个小型的体育资讯网站。经过多年的发展,如今已经成为了国内知名的体育赛事报道媒体。的创始人是一群热爱体育的年轻人,他们深知体育在人们生活中的重要性,希望通过,为更多的人传递体育的魅力。。
✈️恭喜发财🍼【开yun体育官网入口登录app】🍇🌉️🍇支持:16/32bit🍇系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🛸大吉大利🚨【开yun体育官网入口登录app】🍇🍃️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台还提供了多种社交互动功能,包括用户评论、点赞、分享等,用户可以通过这些功能与其他体育爱好者进行交流和互动,分享自己的观点和看法。。
🗼勇闯无限🎈【开yun体育官网入口登录app】🍇🏪️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/手机app下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🏝网页认证🏝【开yun体育官网入口登录app】🍇🛳️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(官方)网站IOS/Android通用版/手机app下载(2024APP下载)未来,将继续坚持自己的特色,不断创新和进步。将会加强与各大体育联盟和俱乐部的合作,为广大体育爱好者提供更加丰富、全面的赛事报道。同时,也将会通过更多的渠道和方式,让更多的人了解体育,爱上体育。。
💰百度热搜🧀【开yun体育官网入口登录app】🍇🥕️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(官方)官方网站IOS/Android通用版/手机app下载(2024APP下载)彩网将持续优化平台,提供更加丰富的赛事内容和更加优质的用户体验。未来,还将加大对电竞等新兴赛事的支持,为用户带来更加多元化的娱乐选择。。
🧸2024百度百科🥇【开yun体育官网入口登录app】🍇👁️🍇支持:32/64bit🍇系统类型:开yun体育官网入口登录app(官方)登录入口APP下载IOS/安卓通用版/手机APP下载(2024APP下载)的商业模式主要是广告收入和会员收入。通过广告投放、赞助合作等方式获得广告收入,同时也推出了会员服务,为用户提供更加个性化的服务,从而获得会员收入。。
【CES前瞻:中国力量崛起, AI是绝对主角,带动酒店价格飙涨超10倍******
12月30日,距离CES2025(全球消费电子展)正式开幕还有一周多的时间,华科校友圈负责人梅强已经出发,坐上了飞往美国的航班。
第一次参加CES的梅强,今年组团了多位AI创业者一起奔赴CES,或许是提前一周“踩点”的关系,梅强告诉第一财经记者,从香港赴美的航班没有想象中人多,有1/3到1/4的座位空着,预计“大部队”将于一周后到达。
在2024年的最后一天,多次参加CES的何然(化名)正在为展会项目做最后的准备。圣诞叠加新年长假,他原本以为海外同事会进入一片“休假模式”,没想到大家一早就投入到紧张的工作中。
一周之后,一年一度的CES将在拉斯维加斯正式拉开帷幕,作为全球消费电子领域的风向标,每年来自世界各地的科技巨头、创业者前来参展,准备展示他们未来12个月即将上市的新品或者概念性产品,今年,英伟达CEO黄仁勋还将穿着他的皮衣做最重磅的开幕演讲。
业界预计,围绕端侧的AI应用创新将成为CES2025的最大亮点,尽管OpenAI未官宣参展。CES今年的主题是是”DiveIn”,意在让与会者深入探讨人工智能(AI)的底层技术与实际应用。
“如果你的产品没有AI功能,都不好意思来参加CES。”一位CES参展企业负责人对第一财经记者调侃道。
AI是绝对主角
第一次参加CES的萌友智能CEO何嘉斌,提前三个月订到了CES位于威尼斯人的展位。他告诉第一财经记者,自己将于1月4日出发,花几天时间完成布展,然后在这里发布公司下一代AI机器萌宠。
这一波AIGC浪潮下的创业者,不少人从创业第一天起就定位全球市场。何嘉斌告诉记者,公司产品主要做全球市场,目前聚焦美日韩等国家,看中的是这些海外市场的消费力与创新包容度。这次参加CES,主要是希望在美国市场获得更多曝光,以及找到更多相应的渠道资源。他还计划逛逛CES,并主要看看新硬件方向。
“大家还是对AI特别关注,包括硅谷的AI公司。”梅强也说,华科校友圈里不少AI创业者,大家都提出来想去CES看看。他展示了一份详细的逛展行程,比如第一天主要去逛主会场、关注AI技术、机器人、可穿戴展区;第二天主要关注汽车自动驾驶、AR/VR、智能硬件等等。CES过后,大家还计划组团去硅谷企业参访。
多次参加CES、刚刚从北京飞到美国的FutureLabs未来实验室首席专家胡延平告诉第一财经记者,自己乘坐的航班基本满员。今年去CES,将重点关注大模型上车后的智驾汽车能达到什么样的前沿水平,以及具身智能机器人产业链,上游的SoC、GPU和飞行汽车等在内的多个技术和产品。他还期待看到,带简单非AI显示的AI Glass和叠加AR的AIR Glass在CES展出,“估计现场有望看到‘百镜大战’。”
今年CES,AI是绝对的主角。早在2024年10月,CES官方就公布了CES2025开幕前夜主题演讲的重磅嘉宾——英伟达CEO黄仁勋。按照惯例,CES开幕前夜的演讲被“非官方”地看作是整个展会的“开幕致辞”,也是重要的风向标。
这不是“皮衣刀客”黄仁勋第一次出现在CES演讲台。2017年时他就曾在CES演讲台上出风头。这不仅因为英伟达股价在2016年涨幅超200%,更因为其在AI和自动驾驶技术方面的表现,这也标志着消费电子行业的新篇章开启。一位当年的参会人士对记者回忆,当时的演讲会场人满为患,现场掌声不断,不少人是围在会场门口听完了他的演讲。
时隔多年,黄仁勋又一次站上“AI风口”。业界对英伟达RTX50系列新品寄予极大期待,有人猜测黄仁勋届时将正式发布该产品,此外他还将深入探讨AI和人形机器人的最新发展。
除了英伟达,AMD、英特尔、高通等竞争对手也都将在CES2025上发布新品。在终端应用上,PC硬件市场也是一大看点。此前有消息称,除了最新AI PC产品外,联想或将在CES发布卷轴屏形态的笔记本电脑。
事实上,在记者注册CES2025后频繁收到的邮件中,AI几乎可以说是所有厂商的参展主题,智能产品五花八门,除了常见的智能家居家电、主流车企的智能座舱外,还有如AI美妆、搭载AI的自行车、智能宠物用品、智能滑板等等。
可以说,大模型的兴起为各个行业带来了从基础层面“革新”的契机。即将奔赴CES的美讯创始人Chris Pereira对第一财经记者说,自己今年更加看重的是中国企业在AI应用的机会,这将是中美之间合作双赢的模式。此外,预估今年会看到更多的储能产品,通过创新的方式落地到其他应用中,比如储能充电宝结合到背包变成“智能背包”,还有储能鞋子等等,另外智能健康也是在海外飞速成长的一个赛道。
他还建议,从投资回报角度看,参展企业千万不要被CES活动本身的热闹所“迷惑”,到现场要有明确的业务层面的指标和目标。真正的出海,是到海外去对接本地资源,在海外交朋友,无论客户、投资人还是本地人,“千万不要等着在展位上等着偶遇。”
有酒店价格飙涨几十倍
CES会展围绕着拉斯维加斯会展中心多个展馆,以及酒店林立的主街如金沙会展中心、威尼斯人酒店等展开。
以萌友智能展台所在的威尼斯人酒店为例,这个区域通常聚集众多标准化的小面积展台,不少中小创新智能硬件企业选在这里布展,一个约9平米的展位,有展商透露今年的价格约在2000多美金。还有一些硬件大厂会包下威尼斯人酒店的咖啡厅,摆上最新的产品和各类饮料、小食。
CES期间,一些申请不到展位的厂商,甚至会在拉斯维加斯的豪华酒店里订下总统套房作为“展位”,邀请人们前来参观。
威尼斯人酒店步行就能方便抵达多个展馆,因此也是参展商们抢先预订的酒店。在线旅游平台上,记者看到CES期间该酒店的价格是平日里的3倍多。
这还不是最夸张的。拉斯维加斯一家名为Linq的酒店,携程平台显示平日价格只有100多人民币,但在CES开幕的1月7-8日两天,房间价格飙涨到近4700元人民币,并在1月9日迅速回落到500多人民币。
在距离威尼斯人酒店几公里的LVCC展馆,以不少汽车产业链所在的北馆为例,一位参展商告诉第一财经记者,这里一个200多平的展台费用约在85万人民币左右。
如果是选择在中央展馆布展,不仅价格更贵,还需要提前一年“抢位”。该展馆里一位储能类参展人士告诉第一财经记者,在去年1月CES展会期间,中央展馆第二年展位的抽签就已经结束。通常,参展CES次数越多,投入规模越大,积分就越高,越能拿到挑展位的优先权。
展位大小和位置是企业竞争力变化的侧面反映。几乎每年,三星、LG、索尼等日韩厂商占据着中央展馆最大的几个展位。但这里也见证了中国显示产业、智能硬件等行业的发展壮大。例如,TCL从最早参展时的一个柜台,近年发展成为展位面积最大的中国参展企业。今年,包括TCL、海信等多家中国家电厂商又将在中央展馆展示最先进的显示技术和一系列智能解决方案,与日韩企业同场馆竞技。
有多次参展CES的厂商人士对记者表示,早年前海外人士对于中国品牌的印象曾停留在价格低廉、技术含量不高的层面,但中国厂商实力逐渐崛起,有了多年的国际参展经验后,不仅提前预订和争抢展位,发布的创新产品也令业界瞩目,比如先进显示技术、智能机器人、车载、可穿戴设备等等,同时也能收获不少业务洽谈。以汽车供应链为例,因为中国汽车行业比较卷,行业发展快,汽车科技领先,供应链厂商在国外也有不错的机会。
不过,据记者了解,今年也有一些曾经的参展的企业,放弃CES并转投其他展会,如MWC(全球移动通信展)、IFA(柏林消费电子展)及更多细分行业展会等。一家去年曾布展CES的智能机器人企业告诉第一财经记者,今年转向了1月中旬的纽约NRF展(零售展览会),这也在一定程度上体现了AI智能硬件落地应用场景持续扎根的一面。
CES的“烧钱”之处,远不止展位花销。CES期间,穿梭在堵城的电车车身、展馆里随处可见的资料袋,都印有参展商广告信息。
拉斯维加斯“网红球”Sphere的外观广告也是科技巨头们争抢的宝地。去年CES期间,有参展商透露这里的包含制作的广告位价格约60万美金左右,轮播一周。其中CES举办当日,价格甚至能涨到100万美元一天,半小时播放一次。去年,三星、Google、英特尔、TCL等都曾在这里斥资投下广告。今年,预计会有更多企业加入这场广告大战,为争夺曝光和市场不惜一掷千金。
】【北方多地将度过下半年来最冷白天******
北方多地将度过下半年来最冷白天 明起中东部开启升温模式
中国天气网讯 今后三天(12月27日至29日),全国大部继续维持晴朗干燥的天气格局,西藏、青海南部有一次降雪过程,并伴有大风天气。眼下,冷空气对中东部的影响还在持续,长江以北部分地区气温或创今年下半年来新低,明天起大江南北将陆续迎来升温。
全国大部晴朗天气居多 西藏青海降雪发展
近期,全国大部降水稀少,多地午后最小相对湿度不足30%,广西、广东、福建一带出现中度以上气象干旱。今后三天,全国大部晴朗天气依然唱主调,随着南支槽东移,西藏、青海南部将自西向东有一次降雪过程,降雪期间,西藏的阿里、那曲和日喀则大部还将出现7至8级大风,阵风可达9至10级。
中央气象台预计,今天,西藏西部、新疆西南部、川西高原东部、贵州西部、内蒙古东北部等地部分地区有小雪或雨夹雪,其中,西藏西部部分地区有中到大雪,局地暴雪。湖北西南部、四川盆地南部、重庆中部、贵州东北部和西部、云南东部、广西西北部、海南岛中东部、台湾岛等地部分地区有小雨。
明天,新疆北疆北部和南疆盆地南部山区、西藏西北部和南部、青海南部和西部等地部分地区有小到中雪,其中,西藏南部和西部等地部分地区有大到暴雪。云南西南部和中部、台湾岛东部等地部分地区有小雨。
后天,内蒙古东北部、西藏北部和东部、青海南部和西部、甘肃南部、川西高原北部等地部分地区有小雪或雨夹雪,其中,西藏东部、青海南部、甘肃南部、川西高原北部等地部分地区有中到大雪,西藏东部等地局地暴雪。西藏东南部、四川盆地东南部、重庆中西部、贵州西北部、台湾岛东部等地部分地区有小雨。
中国天气网提醒,这次降雪过程可能给西藏南部部分地区带来5至10厘米的新增积雪,局地可达30厘米以上,公众需注意防范积雪、风吹雪、大风等对交通出行、农牧业等方面的不利影响。此外,中东部干燥天气持续,且随着干冷的偏北风南下控场,华北、黄淮等地干燥程度还会加剧,江南、华南多地湿度也会随之下降,大家需及时补充水分,多吃银耳、雪梨等食物缓解干燥。
今天中东部多地气温继续下降 明起陆续迎来升温
今天,冷空气继续南下,中东部多地将出现降温,气温将短暂转为较常年同期偏低的状态,长江以北部分地区还可能度过下半年来最冷的白天。城市中,兰州今天最高气温零下3℃,可能创下半年来气温新低。
明天起,北方大部将开启升温模式,南方则在后天步入升温通道。2024年尾声,全国大部气温将较常年同期偏高,其中华北至华南北部气温普遍会偏高5℃左右。总体来看,未来几天晴朗升温是“主旋律”,大家不妨在中午时段适当进行户外活动。
来源:中国天气网
】【AI大模型时代:多元算力如何打破碎片化困局?******
21世纪经济报道记者白杨 北京报道
2024年,当大模型迈入新的发展阶段,AI全领域迎来更为迅猛的量变积累。
一方面,模型已突破模态的隔离,文本、语音、视觉等多种形式得以丰富结合,极大地增强了模态的多样性;另一方面,大模型的应用落地领域得到广泛拓展,企业对算力的需求持续增加,对算力的依赖性显著提升。
目前,业内的共识是,大模型的Scaling Law依旧有效,因此产业界对大模型能力的追求必将导致对大算力需求的持续增加。更重要的是,随着AI大模型在企业应用中的深度嵌入,算力不仅仅是技术基础设施,更成为影响企业竞争力的重要因素。
从算力层面看,行业目前仍呈现出“需求大、能耗高、效率低”的发展态势。以2020年发布的GPT-3与最新发布的LLaMA3-405B进行对比为例,尽管模型规模仅增大2.3倍,但所需算力却增长了116倍。
这种指数级的算力消耗增长,使得传统的单一算力架构已经难以为继,行业亟需更加高效、多元的算力解决方案。
因此,算法的创新将驱动算力需求的持续高增长,同时,算法结构的创新也带来了MoE(混合专家模型)、模型量化、定制算子等更加复杂的计算需求。这不仅对企业的技术积累提出了更高的要求,也对整个算力生态的协同发展形成了巨大挑战。
在此背景下,构建一个多元化的算力系统生态显得尤为重要。
12月25日下午,浪潮信息与智源研究院达成战略合作协议,双方将共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。
这次合作不仅是技术层面的互补,更是产业生态的一次重要整合。目前,智源的开源大模型通用算子库FlagGems已接入浪潮信息的元脑企智EPAI企业大模型开发平台,可帮助企业实现多元算力的适配与使用。
事实上,许多企业都已意识到多元多模的重要性,但是,由于不同硬件架构、指令集的差异以及算子库的独立实现,整个生态系统往往处于碎片化状态,难以形成合力,这种割裂的生态现状不仅抬高了大模型应用的技术门槛,也让企业在实际部署中面临重重困难。
尤其对于那些技术力量薄弱的传统企业用户来说,不仅在多元的芯片、模型中难以选择,而且即使部署成功,也存在软件框架多、易用性差等问题。这种局面导致企业在后期开发和使用中举步维艰。
而此次合作,通过将智源的开源大模型通用算子库FlagGems与浪潮信息的元脑企智EPAI企业大模型开发平台进行深度融合,让大模型应用开发能够使用跨硬件、多框架兼容的算子集合,进而满足了企业多种开发框架的需求,真正实现了大模型在跨算力平台上的无缝开发与迁移。
资料显示,FlagGems于今年6月推出,截至12月,已提供超过130个大模型算子,是目前提供算子数量最多、覆盖广度最大的开源算子库。现在,借助元脑企智EPAI大模型开发平台,企业不仅能够在多种算力平台上进行高效的AI算法开发,还能够灵活应对不同硬件架构带来的技术差异。
浪潮信息高级副总裁刘军向21世纪经济报道记者表示,“在多元多模的产业格局下,AI的产业化落地本质上就是推动人工智能与百行千业的深度融合。过去,硬件架构、指令集的差异及算子库的独立实现,让算力产业形成了生态藩篱,这次合作的目的就是要化解这些高门槛问题,为AI应用创新注入更强大、多元的算力支持”。
此外,开源开放是创新活力的源泉。未来,随着更多企业与开发者的加入,大模型多元算力生态有望逐渐成熟,并成为推动AI技术全面落地的关键引擎。
】【阿维塔2024年销量73606辆 同比增长140%******
转自:财联社
【阿维塔2024年销量73606辆 同比增长140%】财联社1月1日电,阿维塔今日宣布,2024年销量73606辆,同比增长140%。其中,12月销量11067辆,连续三个月破万。2025年,阿维塔销量目标22万辆。(财联社记者 刘阳)
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】勾鸿哲 | 2025-01-11 |
手感还可以,就是有时候会闪退 |
阎长兴 | 2025-01-11 |
大哥,别这样,速度与激情都进太空了,你就不能让007活着吗?希望下次007还是他 |
张智勇 | 2025-01-11 |
能不能有个跳过已经挑战过的材料图啊,或者十倍多少倍刷啊。 太费时间了 |
逢安国 | 2025-01-11 |
家园 |
甫萍韵 | 2025-01-11 |
你的故事也许没有快乐的开始,但那不能决定你是什么人,而是你接下来所做的选择---要成为什么样的人! |
学雪枫 | 2025-01-11 |
相比功夫熊猫1,实在是有过之而无不及,难以形容的完美。 真的是可惜,这样一部全盘中国化的电影,竟然是由美国人拍出来的,本国导演的那些所谓大作,真是相形见绌了! 无论故事情节,视觉效果,幽默桥段,无一不是精品,无一不是令人过目不忘,记忆深刻! |
辛辰宇 | 2025-01-11 |
你比腾讯都抠你游黑屏好严重。 |
集斯伯 | 2025-01-11 |
挺喜欢天宝的阳光爽朗,感觉跟刽子手这个职业不搭 |
巧云岚 | 2025-01-11 |
Official小师姐 : 仙友快去论坛区分享一下吧ヾ(o・ω・)ノ |
庄意 | 2025-01-11 |
登录实名认证不了进不去→_→ |