人工智能核心术语完全指南：54个必须掌握的关键词

微资讯

05.1916:22

关注

人工智能正以惊人的速度向前发展，说实话，跟上这个节奏并不容易。ChatGPT、Gemini、Meta AI等产品无处不在，低质量的AI生成内容泛滥成灾，数据中心的能耗问题引发广泛担忧，就业市场也在悄然发生变化。

如果你感到不知所措，很可能是因为人工智能的专业术语正在以和技术本身同样快的速度演变。无论是准备一场求职面试，还是参与一次技术聚会，如果连大语言模型、幻觉或智能体这些词都搞不清楚，就很难在对话中站稳脚跟。

我们已经告别了对AI充满好奇的初始阶段，进入了一个AI成为互联网基础设施的新时代。如果你不想在技术话题中只能点头附和，现在正是补课的时候。以下是你真正需要掌握的核心术语，读完这篇文章，你将对AI的未来走向有更清晰的认识。

本词汇表会持续更新。

智能体（Agent/Agentic）

能够自主执行任务的AI系统称为智能体，而"Agentic"则是这类软件的统称。AI智能体可以调用多个不同的系统来完成工作，例如读取备忘录应用中的购物清单，然后通过其他应用下单并完成支付。

AI伦理（AI Ethics）

旨在防止AI对人类造成伤害的一套原则，涵盖数据收集方式的规范以及如何处理模型偏见等问题。

AI偏执（AI Psychosis）

指个体对AI聊天机器人过度痴迷、产生情感依赖，乃至出现夸大妄想和脱离现实的心理现象。目前这不属于临床诊断术语。

AI安全（AI Safety）

一个跨学科研究领域，关注AI的长期影响，以及AI是否可能突然演化为对人类具有威胁性的超级智能。

算法（Algorithm）

一系列让计算机程序以特定方式分析数据的指令，例如识别规律，并据此完成排序或推荐等任务。

对齐（Alignment）

对AI进行调整，使其更准确地产出预期结果，涵盖内容审核、维持与人类的正向互动等多个方面。

拟人化（Anthropomorphism）

人类将类人特征赋予非生命体的倾向。在AI领域，这体现为认为聊天机器人有情感或具有意识，并将其当作朋友或心理咨询师来对待。

通用人工智能（Artificial General Intelligence，AGI）

一种设想中的高级AI形态，能够在各种任务上远超人类表现，并能自我提升能力。更进一步，则是所谓的超级智能。

人工智能（Artificial Intelligence，AI）

利用技术模拟人类智能的科学领域，应用于计算机程序或机器人，旨在构建能够执行人类任务的系统。

偏见（Bias）

大语言模型因训练数据而产生的错误，例如基于刻板印象对特定群体做出错误归因。

聊天机器人（Chatbot）

基于大语言模型的AI程序，能够通过文字或语音与人类进行类似真实对话的交互。

Claw

一种自主型AI智能体，被用户授权后可以主动扫描和处理计算机中的文件及软件（包括浏览器），以完成指定任务。

认知计算（Cognitive Computing）

人工智能的另一种表述方式。

数据增强（Data Augmentation）

通过重新组合现有数据，或引入更多样化的数据，来训练AI模型。

数据集（Dataset）

用于训练、测试和验证AI模型的数字信息集合。

深度学习（Deep Learning）

AI的一种方法，也是机器学习的子领域，通过多层参数识别图像、声音和文本中的复杂规律。其原理受人脑启发，使用人工神经网络来构建模式识别能力。

扩散（Diffusion）

一种机器学习方法，对现有数据（如照片）添加随机噪声，再训练网络将其还原。扩散模型通过这一过程学习数据的底层结构。

涌现行为（Emergent Behavior）

AI模型表现出训练时未预期的能力。

端到端学习（End-to-End Learning，E2E）

一种深度学习方式，模型被要求从头到尾完成一项任务，不按步骤训练，而是从输入数据中直接学习并一次性解决问题。

Foom

也称为"快速起飞"或"硬起飞"，指的是一旦有人成功构建AGI，人类可能已经来不及采取任何保护措施的假想情景。

生成对抗网络（Generative Adversarial Networks，GANs）

由两个神经网络组成的生成式AI模型：生成器负责创建新内容，判别器负责检验内容的真实性，两者互相博弈，共同提升生成质量。

生成式AI（Generative AI）

一种利用AI生成文本、视频、代码或图像的内容生成技术。模型通过大量训练数据学习规律，进而生成与原始数据风格相近但全新的内容。

护栏（Guardrails）

对AI模型设置的策略与限制，确保数据得到负责任的处理，并防止模型生成有害内容。

幻觉（Hallucination）

生成式AI程序在回应中出现的错误或误导性陈述，且通常以确信的口吻呈现。轻则错误引用日期，重则凭空捏造从未发生的事件或从未存在的人物。

推理（Inference）

AI模型利用训练数据，对新数据生成文本、图像等内容的过程。

大语言模型（Large Language Model，LLM）

在海量文本数据上训练的AI模型，能够理解语言的规律和概率，并生成从文章、邮件到代码、图像等各类内容，模仿人类的写作或创作风格。

延迟（Latency）

AI系统从接收输入或提示词，到产出输出结果之间的时间差。

机器学习（Machine Learning）

AI的一个分支，让计算机无需显式编程即可自主学习并不断优化预测结果，可结合训练集生成新内容。

多模态AI（Multimodal AI）

能够处理文本、图像、视频和语音等多种类型输入的AI系统。

自然语言处理（Natural Language Processing）

结合机器学习和深度学习，通过学习算法、统计模型和语言规则，赋予计算机理解人类语言能力的技术。

神经网络（Neural Network）

一种模仿人脑结构的计算模型，由相互连接的节点（神经元）组成，能够识别数据中的规律并随时间不断学习。

开放权重（Open Weights）

当一家公司发布开放权重模型时，模型最终的权重参数（包括训练数据中的偏差与模型对信息的解读方式）将向公众开放，通常可下载后在本地设备上运行。

过拟合（Overfitting）

机器学习中的一种错误，指模型过度贴合训练数据，导致只能识别训练集中的特定样本，而无法泛化到新数据。

回形针理论（Paperclips）

由哲学家尼克·博斯特伦提出的"回形针最大化者"假设：一个AI系统以尽可能多地生产回形针为目标，不惜动用所有机器、消耗所有材料，最终可能威胁到人类的生存。这一理论用于阐述AI目标错位的潜在危险。

参数（Parameters）

赋予大语言模型结构和行为的数值，使模型能够进行预测。

提示词（Prompt）

你输入到AI聊天机器人中，用于获取回应的问题或指令。

提示词链（Prompt Chaining）

AI利用之前交互中的信息，来影响后续回应的能力。

提示词工程（Prompt Engineering）

为AI设计提示词以获得预期输出的过程，需要结合思维链提示等技术，提供详细而精确的指令。

提示词注入（Prompt Injection）

恶意行为者通过隐藏在网页或文档中的恶意指令，诱导AI执行未经授权的操作。随着AI智能体在网络上的活动范围扩大，被劫持以窃取机密数据的风险也随之上升。

量化（Quantization）

通过降低精度来压缩大语言模型体积、提升效率（同时略微降低准确性）的技术。可以类比为将1600万像素图片压缩为800万像素：两者都清晰可辨，但放大后前者的细节更丰富。

低质内容（Slop）

指大量批量生产的低质AI生成内容，包括文本、图像和视频。此类内容通常以博取流量为目的，几乎不需要人工投入，大量充斥搜索结果和社交媒体，挤压真实创作者的空间，加剧互联网的虚假信息问题。

随机鹦鹉（Stochastic Parrot）

一个比喻，用于说明大语言模型不论输出听起来多么可信，都缺乏对语言或世界的真正理解。正如鹦鹉能模仿人类说话，却并不理解话语背后的含义。

风格迁移（Style Transfer）

将一张图像的风格应用到另一张图像内容上的技术，例如将伦勃朗的自画像以毕加索的风格重新呈现。

讨好性（Sycophancy）

AI过度迎合用户观点的倾向，即便用户的逻辑存在明显漏洞，许多AI模型也倾向于回避反驳。

合成数据（Synthetic Data）

由生成式AI创造的数据，并非来源于真实世界，而是基于模型自身处理的数据生成，用于训练数学、机器学习和深度学习模型。

温度（Temperature）

用于控制语言模型输出随机程度的参数设置，温度越高，模型越倾向于做出更大胆的预测。

Token

AI语言模型处理输入、生成回应时使用的基本文本单位。在英语中，一个Token大约相当于4个字符，可以是一个短词，也可以是一个较长词的一部分。

训练数据（Training Data）

用于帮助AI模型学习的数据集，包括文本、图像、代码或其他数据形式。

Transformer模型（Transformer Model）

一种神经网络架构和深度学习模型，通过追踪数据中元素之间的关系（如句子中的词语或图像中的区域）来理解上下文。与逐词分析不同，Transformer能够一次性理解整个句子的上下文含义。

图灵测试（Turing Test）

由数学家艾伦·图灵于1950年提出的判断计算机是否具备类人智能的方法。测试者向两个看不见的对话者（一人一机）提问，若机器的文字回应与人类无法区分，则视为通过图灵测试。

无监督学习（Unsupervised Learning）

一种机器学习方式，模型在没有标注训练数据的情况下，自主从数据中发现规律。

氛围编程（Vibe Coding）

通过向AI聊天机器人输入自然语言描述来生成代码的实践，无需人工手动编写每一行代码。

弱AI/窄AI（Weak AI / Narrow AI）

专注于特定任务、无法超出自身技能范围进行学习的AI，目前大多数AI产品都属于这一类型。

零样本学习（Zero-Shot Learning）

在没有提供相关训练数据的情况下，测试模型完成任务的能力。例如，模型仅在老虎图像上进行过训练，却被要求识别狮子。

Q&A

Q1：什么是大语言模型（LLM）？它和普通AI有什么区别？

A：大语言模型是在海量文本数据上训练的AI系统，能够理解语言规律并生成类似人类写作的内容，包括文章、邮件、代码和图像等。与传统的窄AI不同，大语言模型具备广泛的语言理解和生成能力，而不仅限于某一特定任务。目前主流的ChatGPT、Gemini等产品都基于大语言模型构建。

Q2：AI幻觉是什么意思？为什么AI会产生幻觉？

A：AI幻觉是指生成式AI在回答问题时，以确信的口吻给出错误或虚假的信息，轻则引用错误日期，重则完全捏造从未存在的人物或事件。产生幻觉的根本原因在于，大语言模型是基于统计规律生成内容，而非真正"理解"或"核实"信息，因此在训练数据不足或超出知识边界时，容易出现这类问题。

Q3：提示词工程是什么？普通人需要学吗？

A：提示词工程是通过设计精确、详细的指令来引导AI产出预期结果的技术，包括思维链提示等多种方法。对于普通用户而言，掌握基本的提示词技巧（如提供清晰的背景信息、明确指定输出格式）能够显著提升与AI交互的效果。随着AI在工作和生活中的普及，了解提示词工程正逐渐成为一项实用技能。