全球首颗Transformer AI芯片Sohu发布每秒处理速度达50万tokens

6月26日消息,近日,Etched公司成功完成了1.2亿美元(折合人民币约8.73亿元)的A轮融资,这笔资金将被投入到全球首款专为Transformer架构设计的ASIC芯片——Sohu的开发与销售中。

Etched公司,这家由哈佛大学辍学生加文・乌伯蒂(Gavin Uberti)和克里斯・朱(Chris Zhu)创立、运营时间不足2年的初创企业,正以其独特的技术视角和创新力量,引领着人工智能硬件的新潮流。

据了解,Sohu芯片的最大突破在于它直接将Transformer架构蚀刻到芯片中,从而实现了硬件与算法的深度融合。乌伯蒂透露,Sohu芯片采用了台积电的4纳米工艺,这使得其推理性能显著优于传统的GPU和其他通用AI芯片,同时在能耗方面也有更出色的表现。

在性能测试中,以Llama 70B为基准,Sohu芯片每秒能处理超过50万个tokens,这一速度为用户构建出了GPU无法实现的产品提供了可能。此外,Sohu还具备实时语音代理、毫秒级处理大量文本、强大的代码树搜索、并行比较多个响应、多播推测解码以及实时生成新内容等先进功能,为运行未来万亿级参数模型铺平了道路。

猜你喜欢

推荐排行

  • 探秘地下城之王揭开古老传说与未知冒险的完整篇章
  • 实验室水浴锅我的小伙伴在科学探索中
  • 化学蒸馏装置液态智慧的分离大师
  • 教育教学中的实践活动利用水份测定仪教材理解