您的当前位置:首页 >热话

  • 谁将替代 Transformer?谁将替代 Transformer?

    【雷峰网(公众号:雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮都可以直接追溯到 Transformer ...

    时间:2025-08-19 05:28
  • 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍

    编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...

    时间:2025-08-19 05:09
  • 用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

    作者:赖文昕编辑:郭思、陈彩娴说起扩散模型生成的东西,你会立刻想到什么?是OpenAI的经典牛油果椅子?是英伟达Magic3D生成的蓝色箭毒蛙?还是斯坦福大学和微软Folding Diffusion生 ...

    时间:2025-08-19 04:54
  • 专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮

    2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。MiniCPM 2B 有着当之无愧的「小钢炮」 ...

    时间:2025-08-19 04:31
  • 四天六轮谈不拢?加沙停火谈判卡在这三件事四天六轮谈不拢?加沙停火谈判卡在这三件事

    当地时间9日,正在卡塔尔首都多哈进行的新一轮加沙地带停火谈判进入第四天。以色列和巴勒斯坦伊斯兰抵抗运动哈马斯)的谈判小组举行了本轮谈判重启以来的第六轮间接会谈,但尚未取得突破性进展。闭门谈判持续四天 ...

    时间:2025-08-19 04:27
  • 若愚科技:基于多模态大模型的机器人“大脑”领导者若愚科技:基于多模态大模型的机器人“大脑”领导者

    当前,“四肢发达、头脑简单”的传统机器人已经无法满足千行百业“机器代人”的需求,迫切期待机器人从单一场景自动化向复杂场景智能化的拐点出现。传统机器人实现高阶智能的关键是更加智能的机器人“大脑”。近日, ...

    时间:2025-08-19 04:05
  • AI Infra 往事之异构计算篇:吴韧与他的学生们AI Infra 往事之异构计算篇:吴韧与他的学生们

    2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...

    时间:2025-08-19 03:54
  • GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至GAIR 2023 正式开幕:AI 如此绽放之时,昭示着熙春已至

    8月14日,新加坡,大厦起伏如丘,树木葱茏,云卷云舒,风也是清新的。建立在大模型技术爆炸时代语境下的第七届GAIR全球人工智能与机器人大会,正式在新加坡乌节大酒店举办。大会共开设10个主题论坛,聚焦大 ...

    时间:2025-08-19 03:46
  • 对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

    作者丨王悦编辑丨董子博“今年的数字人市场迎来了天翻地覆的变化。”中科深智创始人成维忠对目前国内的数字人市场如是评价。过去,国内数字人企业真正做技术的并不多,大部分以IP打造为主。出道即巅峰的虚拟美妆达 ...

    时间:2025-08-19 03:42
  • 专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮

    2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。MiniCPM 2B 有着当之无愧的「小钢炮」 ...

    时间:2025-08-19 03:30