欢迎光临佛山市鼎盛在线下载官网!

企业新闻| 关于我们| 画册简介| 联系我们| 立即咨询

全国24小时服务热线:

4008-327-669
网站导航
新闻中心
当前位置: 首页 > 新闻中心

Gartner:中国大语言模型价格战推动人工智能加速上云

来源:鼎盛在线下载    发布时间:2024-11-27 16:52:17   点击次数:1

  Gartner研究表明,跟着时间的推移和价格的持续下降,以及云部署在敏捷性、创新速度和生态系统方面的优势,中国企业的人工智能(AI)部署将逐步从本地转向云端。Gartner预测,到2027年,中国的全部AI推理工作负载中,基于云的工作负载占比将从前的20%上升至80%。

  Gartner高级研究总监方琦表示:“多家中国生成式人工智能(GenAI)厂商,其大语言模型应用编程接口(API)的推理成本已经降低了90%以上,有力地推动了企业地GenAI采用。企业数据和分析(D&A)领导者应积极评估相关影响,并扩展GenAI解决方案,以满足未来需要。”

  DeepSeek于2024年5月6日推出了V2模型,价格仅为GPT-4 Turbo的1/75。几天后,字节跳动于5月16日推出豆包大模型,宣称比行业平均价格实惠公道99.3%。作为应对,阿里巴巴、百度和腾讯纷纷调整了其大语言模型API的价格。

  在计算企业GenAI解决方案的总拥有成本(TCO)时,需要将微调成本考虑在内。首先,能够正常的使用高端GenAI模型来评估企业用例的技术可行性,然后使用企业自身的数据,对小型模型进行微调,以执行特定的下游任务。此外,在使用API将数据上传到云端时,还应考虑额外的数据安全和隐私要求。与规模较小的模型相比,最先进的大语言模型的价格变化并不显著,这将进一步减轻价格变革的影响。

  方琦表示:“已部署本地GenAI解决方案的中国企业,不会受到大语言模型 API价格变化的影响。对于云部署来说,API成本只是GenAI解决方案整体成本的一部分。必须要格外注意的是,价格只是评估因素之一,还需要对其他因素进行仔细审查,如模型质量、吞吐量和延时。”

  企业应依据业务重点来选择AI部署方式,尤其需要从六个角度比较云部署和本地部署方案的优劣势,这六个角度分别是:企业数据的主要存放位置、安全和监管合规、专门的基础设施、平台/集成的优劣势、运营支出(OpEx)与资本性支出(CapEx)、人才和技能集合。

  方琦表示:“随着大语言模型API的平均价格不断下降,云部署解决方案在未来将拥有更明显的优势。此外,随技术的加速迭代和相关架构的日益复杂化,云部署解决方案的优势将在许多场景中更加突显。因此,各企业机构要重新评估其AI部署战略。”

  关键字:引用地址:Gartner:中国大语言模型价格战推动人工智能加速上云

  上一篇:高通推出首个利用边缘AI变革网络连接的商用平台——高通A7 Elite专业联网平台

  下一篇:Akamai 宣布推出原生 API 流量分析接口,简化并加快企业API保护

  凤凰网科技讯 (作者/刘正伟)9月7日消息,自上月发布7nm工艺量产芯片后,国内芯片设计公司嘉楠科技正式对外发布具备AI神经网络运算能力的SoC芯片——勘智。 嘉楠科技成立于2013年,专注于高性能重复计算ASIC芯片的设计,可以同时把握人工智能芯片和区块链硬件这两大领域。勘智是嘉楠推出的第一代人工智能芯片(产品型号:K210),它定位于AI与边缘计算两大领域,主要使用在于IoT市场,是一颗集成机器视觉与听觉的系统级芯片(SoC)。 其CPU采用的是RISC-V,提供了机器视觉与语音识别能力的神经网络计算加速IP则为完全自主研发。通过自主研发的神经网络加速器IP,勘智K210可以在超低功耗下进行高速卷积神经网络计算。如基于卷积神经网

  6 月 11 日消息,中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。 此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力、应用成熟度,为模型能力提升和企业选型提供规范性参考。 《智能化软件工程技术和应用要求 第 1 部分:代码大模型》(标准编号 AIIA / PG 0110-2023)标准于 2024 年 1 月 25 日正式对外发布,该标准由中国信通院与中国工商银行联合牵头发起,涵盖通用能力、专用场景能力和应用成熟度三大部分,包括 100 多个能力要求。 此次

  评估,阿里云、华为、商汤等首批通过 /

  10月20日上午消息,谷歌今天推出自有品牌旗舰手机Pixel 6系列,这款手机最大特点是采用了谷歌自研芯片Tensor,Pixel 6售价为599美元起,Pixel 6 Pro手机899美元起,10月28日上市。 全新自研芯片——Tensor Pixel 6系列与之前的任何Pixel以及其他Android手机最大不同之处在于使用了Google Tensor芯片,谷歌自己的定制芯片。 Tensor(张量)是谷歌口中的“公司历史上最大的移动硬件创新”。Tensor并不像苹果的A系列芯片那样在性能上占优,虽然在性能方面,谷歌表示,Tensor芯片使Pixel 6系列的工作速度比去年的中高端Pixel 5快80%。 但谷

  塞进用户手机中 /

  今年Hot Chips()大会的时尚风标从发言上可以看出来,一半的发言都集中在人工智能加速上。Hot Chips是微处理器设计人员的年度聚会,曾几何时,大会大部分的讨论都集中在PC与服务器CPU上。 初创公司Cerebrus、Habana和UpMem都将推出新的深度学习处理器。 Cerebrus将发言描述备受期待的晶圆级整合器件。 Habana的推理芯片则已经发货,Habana会在大会上展示其培训后续工作。 总部在法国格勒诺布尔的UpMem将公布一款新的内存处理器,该款内存处理器据说用了DRAM,可做多种用途。 Graphc

  在Hot Chips会上大放异彩 /

  8月29日至31日,由国家发展改革委、科学技术部、工业与信息化部、国家互联网信息办公室、中国科学院、中国工程院和上海市人民政府共同主办的2019世界人工智能大会(WAIC)将在上海世博中心召开。届时,联合国工发组织总干事李勇,特斯拉CEO马斯克,图灵奖获得者罗杰·雷迪,机器学习之父、卡内基梅隆大学计算机学院院长汤姆·米歇尔等一众大咖将云集上海,为产业带来一场空前的思想盛宴,也为产业高水平质量的发展注入新动能。 而在今年世界人工智能大会拉开帷幕之前,一名AI助理已经正式“就职上岗”。它就是小i机器人专为世界人工智能大会官方微信公众号打造的全新智能客服机器人“小i”,正为即将赶赴这场全球AI顶级盛宴的各位嘉宾提供智能便捷的服务。 不同于广泛接

  由于台积电的产能供应日益紧张,英伟达正考虑将部分人工智能(AI)GPU外包给三星电子生产。据悉,聊天机器人ChatGPT等生成式AI的大火,拉升了对英伟达H100、A100、H800和A800等高性能GPU的需求,这使得该公司在全球AI GPU市场拿下达90%的市占率。 投行摩根大通认为,凭借GPU和网络产品等硬件产品,英伟达今年将在AI产品市场中占据高达60%的份额。 目前,英伟达备受投资者青睐,被认为是满足AI计算能力需求的关键供应商,其高端处理器已被用于训练和运行各种聊天机器人。 今年5月底,英伟达CEO黄仁勋表示,该公司的供应链将力求多元化,目前最高端的H100 GPU除台积电外,也将交由三星、英特尔代工。 然而,韩媒

  科技创新在哪里兴起,发展动力就在哪里迸发,发展制高点和经济竞争力就转向哪里。当前,以AI为代表的新一轮科技革命和产业变革孕育兴起,各个行业相寻找突破口,抢占未来发展先机。那么,在AI行业中,都有哪些“风口”? 人工智能崛起中国发展迅猛引领全球 自上世纪50年图灵的一篇论文《机器人会思考吗?》开启人工智能的大门,人工智能的研究便一时成为科学、资本的热点,但先后经历几次大起大落。然而去年一场人机大战,再次掀起了一场全球AI热潮,至此AI吸引了无数公司参与,无需质疑,AI是当前科技界最热门的事件,也被视为新的科技革命,在这一波浪潮中,中美众多企业非常关注,谷歌、微软、Facebook和百度更是被《财富》杂志被

  【2024年11月13日, 德国慕尼黑讯】 全球功率系统和物联网领域的半导体领导者英飞凌科技股份公司近日宣布推出最新AURIX™ TC4x系列的首款产品AURIX™ TC4Dx微控制器(MCU)。AURIX™ TC4Dx基于28nm技术,可提供更强大的性能和高速连接 。它将功率和性能方面的改进与虚拟化、人工智能(AI)、功能安全、网络安全和网络功能方面的最新趋势相结合,为实现新型电子/电气(E/E)架构和下一代软件定义汽车奠定了基础。像AURIX™ TC4Dx 这样的 MCU 对于控制和监测汽车中的各种系统至关重要,例如车辆运动控制、高级驾驶辅助系统(ADAS)和底盘。 英飞凌AURIX™ TC4x 英飞凌科技微控制

  微电网稳定性分析与控制 提高功率分配和潮流调控水平的微电网建模 稳定分析和控制 (

  东芝1200V SIC SBD “TRSxxx120Hx系列” 助力工业电源设备高效

  STM32N6终于要发布了,ST首款带有NPU的MCU到底怎么样,欢迎小伙们来STM32全球线上峰会寻找答案!

  TI 有奖直播 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

  11月20日消息,日前,2024年世界互联网大会“互联网之光”博览会在浙江乌镇开幕。会上,中国移动与华为、中兴、华三、锐捷、盛科、云豹智能 ...

  轻松化解提升 Kubernetes 采用率方面的三大挑战:缺乏技能、难以扩展以及供应商锁定2024年 11月20日 –负责支持和保护网络生活的云服务 ...

  IC China 2024北京开幕:英特尔分享洞察,促智能计算应用落地

  11月18日,英特尔研究院副总裁、英特尔中国研究院院长宋继强在第二十一届中国国际半导体博览会(IC China 2024)上发表了题为《面向“智 ...

  11月18日,英特尔研究院副总裁、英特尔中国研究院院长宋继强在第二十一届中国国际半导体博览会(IC China 2024)上发表了题为《面向“智 ...

  GenAI能耗的迅速增加将超过电力公司的承担接受的能力Gartner预测,人工智能(AI)和生成式人工智能(GenAI)正在导致用电量飙升,未来两年数据中 ...

  NVIDIA 助力谷歌量子 AI 通过量子器件物理学模拟加快处理器设计

  LT6658BIMSE-2.5 递归参考应用的典型应用电路(VOUT1 为 VIN 和 VIN2 供电)

   使用 Microchip Technology 的 LX1676 的参考设计

  具有 75ms 软启动的 LTC3638IMSE 低输出电压纹波 250mA 稳压器的典型应用电路

  LTC1727IS8-2.5 具有手动复位按钮的三路电源监视器的典型应用

   使用 Microchip Technology 的 PD70101 的参考设计

  企业文化分享 如何培养稀缺的硅IP专业技术人员?SmartDV开启的个人成长与团队协作之旅

  新帅上任:杜德森博士(Dr. Torsten Derr)将于2025年1月1日出任肖特集团首席执行官

  梅赛德斯·奔驰将推出搭载NMC4电池eCitaro 可提供高能量密度和长寿命

  创通联达高通 IOT 平台解决方案及成功案例|报名直播赢【蓝牙耳机、音箱、京东卡】等好礼

  【直播已结束】一起深挖 TI 新发布的 Robotics SDK,看干货直播赢好礼!

  站点相关:综合资讯其他技术下一代网络短距离无线基站与设施RF技术光通讯标准与协议物联网与云计算有线宽带

Copyright © 2012-2020 鼎盛在线下载 版权所有 粤ICP备16110178号 | 网站地图 | 网站目录

地址:广东省佛山市顺德区北滘镇西海二支工业南路 TEL:13928290078

电话:4008-327-669 邮箱:313932331@qq.com

鼎盛在线下载

微信扫一扫