你可能还没注意到,但AI已经悄悄住进了你的浏览器里。

近日,谷歌正式在Chrome浏览器中发布了Prompt API,允许开发者通过简单的JavaScript代码,在网页上直接调用内置的Gemini Nano模型。没错,不需要联网、不需要后端服务器、不需要API Key——AI直接在浏览器本地运行。

这到底意味着什么?

简单来说,以前你要让网页具备AI能力,流程是这样的:用户输入 → 发送到你的服务器 → 调用OpenAI/Claude的API → 拿到结果 → 返回给用户。整个过程依赖网络、有延迟、还要花钱。

现在呢?用户在网页上输入 → 浏览器本地AI模型直接处理 → 即时返回结果。零延迟、零成本、完全离线也能用。

具体能做什么?

除了Prompt API,Chrome这次还一口气上线了好几个内置AI API:

  • Writer API:让AI帮你写内容
  • Rewriter API:改写和优化现有文本
  • Proofreader API:智能校对
  • Summarizer API:一键生成摘要
  • Translator API:浏览器原生翻译
  • Language Detector API:自动识别语言

想象一下:任何网页都可以内置”智能写作助手”、”实时翻译”、”内容摘要”功能,而不需要加载任何第三方服务。

技术细节

JavaScript代码调用浏览器内置AI模型
几行代码就能调用浏览器内置AI

Gemini Nano模型大约2GB大小,首次使用时会自动下载到本地。支持Windows 10/11、macOS 13+、Linux和ChromeOS。目前不支持移动端。支持的编程语言包括中文、英语、法语、德语、西班牙语、日语、韩语等8种语言。开发者只需要这样几行代码就能调用:

const session = await LanguageModel.create();
const result = await session.prompt("帮我总结这段文字的要点");
console.log(result);

上面的代码就是全部了。创建一个AI会话,发送提示词,获取结果。三行代码,不需要任何外部依赖。这就是浏览器内置AI的魅力——把复杂的AI能力封装到最简单的API背后。

为什么这件事很重要?

浏览器内置AI基础设施
AI正在成为浏览器的基础能力

第一,AI从”云端特权”变成了”基础设施”。就像浏览器内置了JavaScript引擎让网页变得交互化一样,内置AI模型会让每个网页都具备智能能力。以前只有大公司能提供的AI功能,现在任何一个前端开发者都能在自己的网页里实现。

第二,隐私保护提升了一个量级。数据完全在本地处理,不需要发送到任何服务器。对于处理敏感内容的场景(医疗、法律、个人笔记),这是一个巨大的优势。你的私人数据永远不会离开你的电脑。

第三,开发门槛大幅降低。前端开发者不需要学后端、不需要买GPU、不需要申请API额度,就能做出AI驱动的应用。这将释放大量创造力,让更多有趣的AI应用涌现。

有什么局限性?

Gemini Nano毕竟是个轻量级模型,能力有限。复杂的推理、长文本生成、多轮对话这些任务,还是得上云端大模型。但对于文本润色、翻译、摘要、分类这类轻量级任务,本地模型完全够用。

另外,目前只有Chrome支持,Firefox和Safari暂时没有跟进的计划。能不能成为Web标准,还得看后续发展。

写在最后

浏览器内置AI,看似是个小更新,实则是Web发展的一个里程碑。当AI变成像CSS和JavaScript一样的基础能力,我们看到的将不再是”AI应用”,而是所有应用都是AI应用

感兴趣的开发者,现在就可以去Chrome开发者文档体验一下。未来已来,只是还没均匀分布。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。