您的当前位置:首页 >热搜大瓜

  • 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

    编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...

    时间:2025-09-04 15:42
  • 苹果发布多模态模型 Ferret苹果发布多模态模型 Ferret

    编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存 ...

    时间:2025-09-04 15:33
  • 昆仑万维开源「天工」13B系列大模型,0门槛商用昆仑万维开源「天工」13B系列大模型,0门槛商用

    10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...

    时间:2025-09-04 15:09
  • 别再声讨零一万物了别再声讨零一万物了

    最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...

    时间:2025-09-04 15:09
  • 苹果发布多模态模型 Ferret苹果发布多模态模型 Ferret

    编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存 ...

    时间:2025-09-04 14:55
  • DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」

    时隔一年半,OpenAI 直接玩了个大的,把文生图和 ChatGPT 做了结合,带着最新版本 DALL·E 3 来了。DALL·E 3 的巨大飞跃主要体现在两大方面。第一,只需要提示词,ChatGPT ...

    时间:2025-09-04 14:40
  • 南方电网发布首个「电力大模型」,百度智能云助力「智能电网」南方电网发布首个「电力大模型」,百度智能云助力「智能电网」

    9月26日,南方电网人工智能公司正式发布了电力行业人工智能创新平台及自主可控电力大模型。据悉,电力行业人工智能创新平台提供模型即服务MaaS),支持模型快速迭代开发,支撑电力人工智能资源面向全社会开放 ...

    时间:2025-09-04 14:30
  • 阿里云 all in AI 的决心阿里云 all in AI 的决心

    如何抓住 AI 的机会?这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一 ...

    时间:2025-09-04 14:30
  • 埋头钻研一年后,阶跃星辰交出了第一份答卷埋头钻研一年后,阶跃星辰交出了第一份答卷

    历经去年持续一年之久的百模大战后,今年伊始,落地应用开始成为大模型的主流叙事方式。本以为,在月之暗面、智谱、MiniMax、百川、零一万物等一众明星企业之后,关于通用大模型的格局既定,没想到,平静水面 ...

    时间:2025-09-04 14:27
  • 别再说国产大模型技术突破要靠 Llama 3 开源了别再说国产大模型技术突破要靠 Llama 3 开源了

    【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...

    时间:2025-09-04 14:11