AES(高级加密标准)是一种对称分组密码算法,被美国政府采用作为加密机密信息的标准。它使用 128、192 或 256 位的密钥以 128 位的固定大小块加密数据。
AI Agent(人工智能代理)是由大语言模型驱动的自主软件系统,通过感知-推理-行动循环(Perception-Reasoning-Action Loop)实现目标导向的任务执行,能够调用工具、管理...
AI幻觉是 AI 系统中的一种现象,模型生成的信息看起来自信且权威,但实际上是事实错误的、捏造的,或在训练数据或现实中没有依据。
ASCII(美国信息交换标准代码)是一种字符编码标准,为 128 个字符分配数值,包括英文字母、数字、标点符号和控制字符。它构成了现代文本编码系统的基础。
Base64 是一种将二进制数据转换为 ASCII 字符串格式的编码方案。它使用 64 个可打印字符(A-Z、a-z、0-9、+、/)来编码二进制数据。
BMI 是根据人的体重和身高计算出的数值,用作筛查工具,将个人分类为体重不足、正常体重、超重和肥胖等体重状态类别。
CMYK 是一种用于彩色印刷的减色模型,通过混合不同比例的青色、品红、黄色和黑色油墨,在纸张和其他物理介质上创建广泛的色彩范围。
Cron 是类 Unix 操作系统中基于时间的任务调度器,允许用户安排命令或脚本在指定的时间间隔自动运行。它使用一种称为 cron 表达式的特殊语法来定义任务执行的时间。
CSV(逗号分隔值)是一种纯文本文件格式,使用逗号分隔值、换行符分隔记录来存储表格数据。它是应用程序之间数据交换最常见的格式之一,特别是电子表格和数据库。
DPO(Direct Preference Optimization,直接偏好优化)是一种简化的语言模型人类偏好对齐方法,直接使用偏好数据优化策略,消除了 RLHF 中需要单独奖励模型和强化学习阶段的...
Emoji 是一套在 Unicode 中编码的标准化象形符号和图标,用于数字通信中表达情感、物体、概念和想法,可在不同平台和设备之间使用。
Encryption(加密)是使用数学算法和密钥将明文数据转换为不可读格式(密文)的过程,确保只有拥有正确解密密钥的授权方才能访问原始信息。
EXIF 是一种标准,指定了数码相机和智能手机使用的图像、声音和辅助标签的格式,在图像文件本身中存储相机设置、日期/时间、GPS 位置等元数据。
Geohash 是一种地理编码系统,将地理坐标(纬度和经度)编码为由字母和数字组成的短字符串。它由 Gustavo Niemeyer 于 2008 年发明,提供了一种将世界划分为网格单元的分层空间数据...
GIF(图形交换格式)是 CompuServe 于 1987 年开发的位图图像格式,支持最多 256 种颜色和动画。它广泛用于网络上的短动画、表情包和简单图形。
Glob 是一种使用通配符字符来指定文件名或路径集合的模式匹配语法。它起源于 Unix shell,现在广泛用于编程语言、构建工具和文件系统。
Go(也称为 Golang)是一种静态类型的编译型编程语言,由 Google 设计。它强调简单性、效率,并通过 goroutine 和 channel 内置支持并发编程。
GPT模型是由 OpenAI 开发的大型语言模型系列,采用带有自注意力机制的 Transformer 架构,通过预测序列中的下一个 token 来生成类人文本,在海量文本语料上进行预训练,并针对各种下...
GUID(全局唯一标识符)是微软对 UUID 标准的实现,是一个 128 位的标识符,用于在计算机系统中唯一标识信息。GUID 和 UUID 本质上是同一事物,只是名称不同。
Gzip 是一种文件压缩格式和软件应用程序,使用 DEFLATE 算法来减小文件大小,广泛用于压缩网页内容和减少 HTTP 传输中的带宽消耗。
HMAC(基于哈希的消息认证码)是一种加密技术,将密钥与哈希函数结合以验证消息的完整性和真实性。它确保数据未被篡改并来自可信来源。
HSL颜色(色相、饱和度、亮度)是一种圆柱形颜色模型,以比 RGB 更直观的方式表示颜色,便于人类理解和操作。它将颜色分为三个组成部分:色相(颜色本身)、饱和度(颜色强度)和亮度(明暗程度)。
HTML实体是以 & 开头、以 ; 结尾的字符串,用于表示 HTML 中的特殊字符,这些字符要么会被解释为 HTML 代码,要么无法通过键盘直接输入。
IP地址是分配给连接到使用互联网协议进行通信的计算机网络的每个设备的唯一数字标识符。它有两个主要功能:主机识别和位置寻址。
ISO 8601 是一种用于以清晰、无歧义格式表示日期和时间的国际标准,使用 YYYY-MM-DDTHH:MM:SS 模式,可选附带时区信息。
JavaScript 是一种高级解释型编程语言,使网页具有交互性,是 Web 应用程序的重要组成部分。它在浏览器和服务器(Node.js)上运行,使其成为最通用的编程语言之一。
JPEG(联合图像专家组)是一种常用的数字图像有损压缩方法,特别适用于照片。该格式通过丢弃一些人眼不太能感知的图像数据来实现显著的文件大小减小。
JSON(JavaScript 对象表示法)是一种轻量级的、基于文本的数据交换格式,易于人类阅读和编写,也易于机器解析和生成。它基于 JavaScript 语法的一个子集,但与编程语言无关。
JSON Schema 是一种词汇表,允许您注释和验证 JSON 文档。它描述 JSON 数据的结构、约束和文档,支持自动验证和文档生成。
JSON Web令牌是一种紧凑的、URL 安全的方式,用于在两方之间传递声明。JWT 中的声明被编码为 JSON 对象,并使用加密算法进行数字签名。
JSONPath 是一种用于 JSON 文档的查询语言,能够使用类似于 XML 的 XPath 的路径表达式从复杂的 JSON 结构中提取和过滤数据。
LoRA(Low-Rank Adaptation,低秩适应)是一种参数高效的微调技术,通过在 Transformer 层中注入可训练的低秩分解矩阵来适应大型预训练模型,在保持模型性能的同时大幅减少可训...
Lorem Ipsum 是一种伪拉丁语占位文本,常用于平面设计、Web 开发和出版中,用于展示视觉布局而不受有意义内容的干扰。自 16 世纪以来,它一直是行业标准的虚拟文本。
Markdown 是由 John Gruber 于 2004 年创建的轻量级标记语言,用于格式化纯文本文档。它使用简单直观的语法,可以轻松转换为 HTML 和其他格式,同时保持原始形式的可读性。
MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 于 2024 年推出的开放协议标准,通过 JSON-RPC 2.0 规范实现 AI 应用与外部工具、数据...
MD5(消息摘要算法5)是一种广泛使用的加密哈希函数,它产生一个128位(16字节)的哈希值,通常表示为32个字符的十六进制数。它被设计用作校验和来验证数据完整性。
MIME类型是一种标准化标识符,用于指示文件或数据的性质和格式,由类型和子类型组成,中间用斜杠分隔,使互联网上的内容能够被正确处理。
Mock Data(模拟数据)是人工生成或模拟的数据,用于测试、开发和演示目的,使开发人员无需依赖真实的生产数据或外部服务即可工作。
NanoID 是一个用于 JavaScript 的小巧、安全、URL 友好的唯一字符串 ID 生成器。它生成比 UUID 更短的紧凑标识符,同时保持类似的碰撞抵抗能力。
Password(密码)是用于验证用户身份并授予对受保护系统、账户或数据访问权限的秘密字符串。
PDF(便携式文档格式)是 Adobe 于 1992 年开发的文件格式,用于在不同平台和设备上一致地呈现文档。无论使用什么软件、硬件或操作系统查看,它都能保留字体、图像、图形和布局。
PEFT(Parameter-Efficient Fine-Tuning,参数高效微调)是一系列技术,通过仅训练一小部分参数来使大型预训练模型适应下游任务,在保持竞争性能的同时大幅降低计算需求。
PNG(便携式网络图形)是一种支持无损数据压缩和透明度的光栅图形文件格式。它作为 GIF 的改进、无专利替代品而创建,广泛用于网页图形。
REST接口是一种用于设计网络应用程序的架构风格,使用 HTTP 请求对由 URL 标识的资源执行 CRUD 操作(创建、读取、更新、删除)。它强调无状态通信和统一接口。
RGBA颜色是 RGB 颜色模型的扩展,增加了用于控制不透明度的 alpha 通道,允许定义从完全透明(0)到完全不透明(1)的颜色。
RGB颜色是一种加色模型,通过将红、绿、蓝光以不同强度组合来创建广泛的颜色光谱。每个颜色通道通常范围从 0 到 255,允许超过 1600 万种可能的颜色组合。
RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)是一种训练技术,通过使用人类反馈训练奖励模型,然后通过强化学习优化来引导模型行为...
RSA(Rivest-Shamir-Adleman)是一种非对称加密算法,使用一对密钥——公钥用于加密,私钥用于解密。它是最早的实用公钥密码系统之一,广泛用于安全数据传输。
SHA-256(安全哈希算法256位)是一种加密哈希函数,产生256位(32字节)的哈希值,通常表示为64个字符的十六进制数。它是由NSA设计的SHA-2系列的一部分,广泛用于数据完整性验证和数字签名...
Skill 是一种模块化、可复用的能力,用于扩展 AI 智能体的功能,使其能够通过定义的接口和提示词执行特定任务或访问专业知识。
Slug 是字符串的 URL 友好版本,通常从标题或名称派生,只使用小写字母、数字和连字符。它用于为网页、博客文章和其他内容创建人类可读且 SEO 友好的 URL。
SSL/TLS安全协议是设计用于在计算机网络上提供安全通信的加密协议。TLS 是 SSL 的继任者,用于加密客户端和服务器之间传输的数据。
SVG(可缩放矢量图形)是一种基于 XML 的矢量图像格式,用于二维图形,支持交互性和动画。与光栅图像不同,SVG 图形可以缩放到任何尺寸而不会损失质量。
Timezone(时区)是地球上为法律、商业和社会目的而采用统一标准时间的区域,通常定义为与协调世界时(UTC)的偏移量。
Token(令牌)是大型语言模型(LLM)处理文本的基本单位,代表一段可以是单词、子词、字符或标点符号的文本片段。分词(Tokenization)是将文本分解为这些离散单元的过程,使模型能够将人类可读...
TOML 是一种配置文件格式,设计目标是因其显而易见的语义而易于阅读,能够明确映射到哈希表同时保持解析简单。
Transformer模型是一种深度学习架构,由 Google 研究人员在具有里程碑意义的论文《Attention Is All You Need》(2017)中提出,它通过用自注意力机制取代循环神经...
TypeScript 是一种强类型编程语言,通过添加可选的静态类型注解来构建在 JavaScript 之上。由 Microsoft 开发,它编译为纯 JavaScript,可以在任何 JavaScri...
Unicode 是一种通用字符编码标准,为世界上每种书写系统的每个字符分配一个唯一的数字(码点)。它旨在表示人类交流中使用的所有字符,包括字母、符号和表情符号。
Unix时间戳(也称为 Unix 纪元时间或 POSIX 时间)是一种将时间表示为自 Unix 纪元(1970 年 1 月 1 日 00:00:00 UTC)以来累计秒数的系统。它提供了一种简单、与时...
URL 编码(百分号编码)是一种在统一资源标识符(URI)中编码信息的机制,通过将不安全的 ASCII 字符替换为 '%' 后跟两个表示字符字节值的十六进制数字来实现。
UTF-8(8 位 Unicode 转换格式)是一种可变宽度字符编码,可以表示 Unicode 标准中的每个字符。它每个字符使用 1 到 4 个字节,并且向后兼容 ASCII。
UUID(通用唯一标识符)是一个 128 位的标识符,保证在所有空间和时间上都是唯一的。UUID 表示为 32 个十六进制数字,以 8-4-4-4-12 的格式分成五组,用连字符分隔。
WebP 是 Google 开发的现代图像格式,为 Web 图像提供卓越的无损和有损压缩。它通常比 JPEG 和 PNG 产生更小的文件大小,同时保持相当的质量。
XML(可扩展标记语言)是一种用于存储、传输和重构数据的标记语言和文件格式。它定义了一套规则,用于以人类可读和机器可读的格式编码文档。
XPath 是一种用于从 XML 文档中选择节点和计算值的查询语言,使用路径表达式来导航 XML 数据的层次结构。
YAML(YAML Ain't Markup Language)是一种人类可读的数据序列化语言,常用于配置文件和数据交换。它使用缩进来表示结构,使其比 JSON 或 XML 更易于阅读复杂的嵌套数据。
上下文学习(In-Context Learning,ICL)是大语言模型从输入提示中提供的示例学习和适应新任务的能力,无需更新模型参数或进行显式训练。
上下文窗口是大语言模型在单次交互中能够处理的最大 token 数量,包括输入提示和生成的输出,它决定了模型在生成响应时能够考虑多少信息。
二维码是一种二维矩阵条形码,可以存储各种类型的数据,包括 URL、文本、联系信息等。它由 Denso Wave 于 1994 年发明,用于追踪汽车零部件,此后已广泛用于移动扫描应用。
二进制(也称为 base-2)是一种只使用两个符号的数字系统:0 和 1。它是计算机的基础语言,所有数据和指令最终都表示为二进制数字(位)序列。
人工智能(Artificial Intelligence,AI)是计算机科学的一个分支,专注于创建能够执行通常需要人类智能才能完成的任务的智能系统,包括学习、推理、问题解决、感知和自然语言理解。
代码压缩是在不改变代码功能的前提下,移除源代码中所有不必要字符的过程,包括空白符、注释,以及缩短变量名,以减小文件体积并提高加载速度。
代码检查是使用自动化工具分析源代码以发现潜在错误、bug、风格问题和可疑构造的过程,无需实际执行代码。
代码美化是通过添加适当的缩进、换行和一致的空格来格式化代码或数据以提高可读性的过程,本质上是代码压缩的反向操作。
内容分发网络是一个地理分布的代理服务器和数据中心网络,通过从最接近最终用户的位置提供资源来协同工作,实现互联网内容的快速交付。
函数调用是大语言模型的一项能力,允许模型生成结构化输出,指定要调用的函数及其参数,使 AI 系统能够以可靠且类型安全的方式与外部工具、API 和服务进行交互。
十六进制(也称为 hex 或 base-16)是一种使用 16 个不同符号的位置计数系统:数字 0-9 表示值 0-9,字母 A-F(或 a-f)表示值 10-15。它提供了一种人类友好的方式来表示二...
十六进制颜色是一种用于网页设计和数字图形的六位字母数字颜色表示法,由三对十六进制值(00-FF)组成,分别代表红、绿、蓝三个颜色通道。
卷积神经网络(CNN,Convolutional Neural Network)是一类专门用于处理图像等结构化网格数据的深度神经网络,通过卷积层使用可学习的滤波器自动学习空间层次特征,从而检测边缘、纹...
反向传播(Backpropagation)是一种训练人工神经网络的基础算法,它利用微积分中的链式法则,通过将误差从输出层反向传播到输入层来高效计算梯度。该算法通过计算每个权重对整体误差的贡献程度,实现...
变分自编码器是一种生成式深度学习模型,它将神经网络自编码器与变分贝叶斯推断相结合,学习将输入数据编码到连续的潜空间中,并解码重建或生成新的数据样本。
向量嵌入是一种机器学习技术,将离散数据(如单词、句子或实体)转换为高维空间中的连续稠密向量,使语义相似的项目映射到相近的点。
向量数据库是一种专门设计用于存储、索引和查询高维向量嵌入的数据库,能够对文本、图像和音频等非结构化数据进行高效的相似性搜索和检索。
哈希是一种数学函数,可将任意大小的输入数据转换为固定长度的字符串,生成一个几乎不可能逆向还原为原始数据的唯一数字指纹。
图片压缩是通过移除冗余或不太重要的数据来减小数字图像文件大小的过程,使用无损方法(保留所有数据)或有损方法(牺牲部分质量)。
域名系统是一种分层分布式命名系统,将人类可读的域名(如 example.com)转换为计算机用于在网络上相互识别的 IP 地址(如 192.0.2.1)。
多智能体系统是一种 AI 架构,其中多个自主智能体协作、通信和协调以解决单个智能体难以完成的复杂任务,每个智能体具有专门的能力和角色。
多模态 AI 是指能够处理、理解和生成多种数据类型(如文本、图像、音频和视频)内容的人工智能系统,实现更全面、更接近人类的交互方式。
大语言模型(LLM,Large Language Model)是一种在海量文本数据上训练的人工智能模型,能够以出色的流畅性和上下文感知能力理解、生成和处理人类语言,为对话式 AI 到代码生成等应用提供...
安全超文本传输协议是 HTTP 的安全版本,使用 TLS(传输层安全)加密浏览器与服务器之间的所有通信。它保护数据完整性、机密性,并验证服务器身份。
宽高比是图像、视频或显示器的宽度和高度之间的比例关系,通常用冒号分隔的两个数字表示(例如 16:9、4:3)。
小样本学习是一种机器学习范式,模型仅从少量示例(通常 1-10 个)中学习执行任务,利用先验知识从最少的训练数据中进行泛化。
层叠样式表是一种样式表语言,用于描述 HTML 和 XML 文档的呈现。它控制网页的视觉外观,包括布局、颜色、字体和响应式设计。
差异对比是一种比较技术,用于识别和显示两组数据(通常是文本文件或代码)之间的差异,显示添加、删除或修改的内容。
序列化是将复杂数据结构或对象转换为可存储、传输或稍后重建的格式的过程,通常表现为字节流或文本表示。
应用程序接口是一组规则、协议和工具,允许不同的软件应用程序相互通信。它定义了软件组件应如何交互,使开发人员能够访问其他服务的功能或数据。
开放授权是一种开放标准授权协议,允许用户授予第三方应用程序有限访问其资源的权限,而无需共享其凭据。它通过访问令牌实现安全的委托访问。
强化学习(Reinforcement Learning,RL)是一种机器学习方法,智能体通过与环境交互,以奖励或惩罚的形式接收反馈,并通过策略调整其行为以最大化长期累积奖励来学习做出最优决策。
循环神经网络是一类专门用于处理序列数据的神经网络,通过维护隐藏状态来捕获前序时间步的信息,使网络能够学习文本、语音和时间序列数据中的时间依赖关系和模式。
微调(Fine-tuning)是一种迁移学习技术,通过在较小的特定任务数据集上继续训练过程,将预训练的机器学习模型适配到特定任务或领域。这种方法利用预训练模型中已捕获的通用知识,同时为专业应用定制其行...
思维链(Chain-of-Thought,CoT)是一种提示技术,通过引导大语言模型将复杂推理任务分解为中间步骤,模拟人类思维过程来提高准确性和可解释性。
情感分析是一种自然语言处理(NLP)技术,用于从文本中识别和提取主观信息,判断所表达的观点是正面、负面还是中性。它涵盖文档级分析(整篇文本的整体情感)、句子级分析(单个句子的情感)和方面级分析(针对文...
扩散模型是一类生成式深度学习模型,通过逐步对正态分布变量进行去噪来生成数据,逆转前向扩散过程——该过程逐步向训练数据添加高斯噪声直至变成纯噪声。
持有者令牌是 HTTP 认证中使用的一种访问令牌类型,客户端出示令牌以访问受保护的资源。术语 'bearer' 意味着持有令牌的任何一方都可以使用它来访问资源,而无需额外的身份证明。
推荐系统是一种信息过滤系统,基于用户的偏好、行为和历史交互来预测和推荐用户可能感兴趣的项目或内容。它利用协同过滤、基于内容的过滤和混合方法等机器学习算法来提供个性化体验。
提示注入是 LLM 应用中的一种安全漏洞,恶意用户输入通过覆盖或绕过系统提示来操纵模型的行为,可能导致模型忽略安全准则、泄露敏感信息或执行非预期操作。
提示词是提供给 AI 模型的自然语言输入或指令,用于引导模型生成响应,作为人机交互的主要接口,通过精心设计的文本、上下文和格式指令来塑造模型的输出。
提示词工程是一种设计、优化和迭代输入指令(提示词)的实践方法,旨在与大语言模型(LLM)及其他生成式 AI 系统进行有效沟通,以获得准确、一致且可靠的输出结果。
数据URL是一种 URI 方案,允许将小型数据项内联嵌入到网页文档中,就像它们是外部资源一样,使用 Base64 编码将二进制数据直接表示在 URL 字符串中。
文生图是一种人工智能技术,能够根据自然语言文本描述生成视觉图像,利用深度学习模型解析文本提示并合成相应的逼真或艺术风格图像。
无监督学习(Unsupervised Learning)是一种机器学习类型,算法在没有预定义输出或人工监督的情况下从未标记数据中学习模式。系统通过识别相似性、差异性和分组,自主发现数据中隐藏的结构、关...
时间戳是一串字符或编码信息,用于标识某个事件发生的确切时间,通常包含日期和时间。在计算机中,时间戳用于记录数据的创建、修改或访问时间。
机器学习(Machine Learning,ML)是人工智能的一个子领域,它使计算机系统能够在无需显式编程的情况下,自动从经验中学习和改进。它专注于开发能够访问数据、从中学习并基于发现的模式做出预测或...
条形码是一种使用平行线条图案(一维)或几何图案(二维)的机器可读数据表示形式,可以快速扫描以检索编码信息。
查询字符串是 URL 中用于向 Web 应用传递数据的部分,出现在问号(?)之后,由以 & 分隔的键值对组成。
校验和是从另一块数字数据中派生出的小块数据,用于检测在传输或存储过程中可能引入的错误。
梯度下降(Gradient Descent)是一种一阶迭代优化算法,通过沿着梯度的负方向(即最陡下降方向)重复移动来寻找函数的最小值。它是训练机器学习模型、最小化损失函数的基础优化技术,常见变体包括随...
检索增强生成是一种 AI 架构,通过在生成响应之前从外部知识库检索相关信息来增强大语言模型的输出,结合信息检索系统和生成式 AI 的优势,产生更准确、更新和可验证的答案。
模型对齐是训练 AI 系统使其行为符合人类价值观、意图和期望的过程,确保模型有用、无害且诚实,同时避免非预期或有害的行为。
模型推理(Inference)是使用已训练好的模型对新的、未见过的数据进行预测或生成输出的过程,代表了将学习到的模式应用于实际输入的部署阶段,期间不更新模型参数。
正则表达式(Regex)是定义搜索模式的字符序列,主要用于字符串中的模式匹配。正则表达式提供了一种强大而灵活的方式来搜索、匹配和操作文本。
注意力机制(Attention Mechanism)是一种神经网络技术,它通过计算加权重要性分数,使模型能够动态地关注输入数据的相关部分,从而在进行预测或生成输出时选择性地关注最相关的信息。
深度学习(Deep Learning)是机器学习的一个子集,它使用具有多层结构的人工神经网络(深度神经网络)从原始输入数据中逐步提取更高层次的特征,从而实现分类、检测和生成等任务的自动表示学习。
温度参数是大语言模型中控制生成输出随机性和创造性的超参数,较低的值产生更确定性和聚焦的响应,而较高的值则增加多样性和创造性。
生成对抗网络是一类由两个神经网络组成的深度学习模型——生成器和判别器——通过对抗竞争同时训练,其中生成器学习创建逼真的合成数据,而判别器学习区分真实样本和生成样本。
生成式AI是一类能够创建新内容的人工智能系统,包括文本、图像、音频、视频和代码,通过从现有数据中学习模式并生成与训练数据相似的新颖输出。
监督学习是一种机器学习范式,模型从带标签的训练数据中学习,使用输入输出对来发现模式并对新的未见数据进行预测。
知识图谱是真实世界实体及其关系的结构化表示,组织为节点(实体)和边(关系)的网络,使机器能够理解和推理相互关联的信息。
知识蒸馏是一种模型压缩技术,通过训练较小的「学生」模型来模仿较大「教师」模型的行为,将知识转移以创建保留大部分原始性能的高效模型。
神经网络是一种受人脑生物神经网络启发的计算模型,由分层组织的相互连接的节点(神经元)组成,使用连接主义方法处理信息。
空白字符指的是在文本中表示水平或垂直空间但在渲染时通常不可见的字符,包括空格、制表符、换行符和其他格式化字符。
纪元时间(也称为 Unix 时间、POSIX 时间或纪元秒)是一种时间表示系统,将时间点表示为自 1970 年 1 月 1 日 00:00:00 UTC 以来经过的秒数(不计闰秒)。
结构化查询语言是一种标准化的编程语言,专为管理和操作关系数据库而设计。它用于查询、插入、更新和删除数据,以及创建和修改数据库结构。
统一资源定位符是一种特定类型的 URI,提供了在互联网上定位资源的完整地址,包括协议、域名、路径和可选参数。
统一资源标识符是一串用于标识互联网或系统内资源的字符,使用特定语法提供了一种标准化的方式来定位或命名资源。
聊天机器人是一种人工智能软件应用程序,旨在通过文本或语音界面与用户模拟类人对话。聊天机器人的类型从遵循预定义脚本的简单规则型系统,到利用自然语言处理(NLP)和大型语言模型(LLM)来理解上下文、意图...
自动驾驶(Autonomous Driving)是一种使车辆能够在无需人工干预的情况下自主导航和运行的技术,它结合了传感器、人工智能和控制系统。自动驾驶涵盖了 SAE 国际定义的各种自动化级别,从 L...
自然语言处理是人工智能的一个分支,专注于使计算机能够以有意义和有用的方式理解、解释、生成和响应人类语言。它将计算语言学与机器学习和深度学习技术相结合,弥合人类交流与计算机理解之间的鸿沟。
计算机视觉(Computer Vision)是人工智能的一个领域,使计算机能够解释和理解来自世界的视觉信息,如图像和视频。它涉及开发能够自动从视觉数据中提取有意义信息的算法和模型,模拟人类的视觉感知能...
训练数据(Training Data)是用于教导机器学习模型识别模式、进行预测或执行特定任务的标注或未标注样本集合。它是算法在模型开发过程中学习的基础输入。
语义搜索是一种信息检索技术,它理解搜索查询背后的含义和意图,而不仅仅是匹配关键词,使用向量嵌入和自然语言理解来查找概念相关的结果。
语音识别(Speech Recognition)是一种使计算机能够识别并将口语转换为文本的技术,也称为自动语音识别(ASR)或语音转文本(STT)。它利用声学模型、语言模型,以及越来越多的端到端深度学...
超文本传输协议是万维网的基础协议,定义了消息如何在 Web 浏览器和服务器之间格式化和传输。它是一种无状态的应用层协议,能够检索链接的资源。
超文本标记语言是用于创建网页和 Web 应用程序的标准标记语言。它使用标签和属性系统定义 Web 文档的结构和内容。
跨域资源共享是一种安全机制,允许 Web 浏览器向与提供网页的域不同的服务器发出请求。它使用 HTTP 头来告诉浏览器应该允许哪些跨源请求。
转义字符是一种触发后续字符在字符串中进行替代解释的字符,通常用于表示换行符、制表符等特殊字符,或原本具有特殊含义的字符。
过拟合(Overfitting)是机器学习中的一种建模错误,当模型过度学习训练数据(包括其中的噪声和随机波动)时发生,导致模型在新的、未见过的数据上泛化性能较差。
通用人工智能是一种理论上的人工智能形式,具备在广泛任务领域中理解、学习和应用知识的能力,其认知水平可达到或超越人类,与专为特定任务设计的狭义人工智能系统不同。
量化是一种模型压缩技术,将神经网络权重和激活值从高精度表示(如 32 位浮点数)降低到低精度格式(如 8 位或 4 位整数),在保持可接受精度的同时显著减少模型大小和推理成本。
零样本学习是一种机器学习范式,模型在没有任何任务特定示例的情况下执行任务,仅依靠其预训练知识和自然语言指令来理解和执行新任务。