机器学习搜索

借助机器学习将搜索提升到全新水平

Elastic 采用的是最新的机器学习和自然语言处理技术。提供的功能灵活且易于实施,您可以借助这些工具构建与生成式 AI 集成的 AI 搜索应用程序,并支持语义和多模式搜索、个性化和问题回答功能,从而显著改善搜索体验。

观看 Elastic 和 Cohere 讨论构建 RAG 的高级策略和最佳实践。

观看网络研讨会

尝试 Elastic 的低代码 Playground,并在几分钟内使用自己的专有数据快速测试 LLM。

探索 Playground

了解有关 Elastic 最新机器学习进展的更多信息。

了解有关 Search Labs 的更多信息

生成式 AI 工具

构建强大的 AI 搜索应用程序

使用 Elasticsearch 相关性引擎创建新一代的语义搜索应用程序。应用 Elastic 的向量数据库和开箱即用的转换器模型,进行跨域语义搜索,以及使用关键字搜索和语义检索优化搜索的混合排名。

  • 进入 LLM 生态系统

    通过使用 Elastic 的开放式推理 API,无论是您自己的嵌入技术还是 Elastic 的专有稀疏编码器模型,都能简化代码并轻松管理多云环境下的推理任务。创建终端并使用来自领先供应商的各种机器学习模型。

  • 通过自动分块掌握长文本

    使用 semantic_text 轻松处理长文本段落。Elastic 的开放式推理 API 与 semantic_text 字段可自动将文档分块为保留上下文的部分,确保准确的嵌入和最佳的搜索结果。告别编写自定义分块逻辑。

  • Lucene 10 正式推出!

    Apache Lucene 10 可最大限度地提高 AI 搜索应用程序的硬件效率。通过改进搜索并行性以实现低延迟查询、异步 I/O 操作以实现更高的吞吐量以及优化 CPU 和存储效率,Lucene 10 为更快、更高效的搜索体验铺平了道路 — — 特别是在大型数据集上。

  • 带 BBQ 顺序的 Elasticsearch

    Elastic 是首个提供更好的二进制量化 (BBQ) 的版本,这是针对向量数据库的优化,可提高性能和效率。BBQ 具有标量量化的速度和存储效率,可提供较高的排序质量。它可减少 95% 的内存,并具有很高的召回率,能以经济实惠的方式扩展向量存储,适用于大型数据集。

功能

机器学习唾手可得

借助 Elastic,您可以通过在本地运行的机器学习 和向量搜索,构建 AI 搜索应用程序,以实现卓越的搜索相关性、性能和个性化结果。支持对数据集进行分类,检测异常,识别和预测 趋势。

  • 向量搜索

    Elastic 基于 Lucene 向量字段和近似最近邻(ANN,使用 HNSW)搜索构建而成,通过将搜索查询与基于向量的搜索概念进行匹配,使搜索应用程序响应得更快、更准确 — 这一点大规模搜索中,表现尤为突出。使用 Elastic 的向量数据库创建、存储和查询嵌入。

  • 自然语言处理支持和模型管理

    通过支持现代自然语言处理,您可以将 PyTorch、Python 和转换器模型与 Elasticsearch 采集管道结合使用,以进行情感分析、文本分类和命名实体识别 (NER)。支持直接从 Hugging Face 导入热门的转换器模型。

  • 预测模型

    构建并应用预测模型(监督式学习),对数据进行分类或预测趋势。要在 Elastic 中应用预测模型,请使用我们的转换实用工具将原始数据从 Elasticsearch 索引转换为数据帧。

Elasticsearch - 部署最广泛的向量数据库

在两分钟内复制到本地进行试用

curl -fsSL https://elastic.co/start-local | sh
阅读文档

常见的机器学习任务

将机器学习添加到您的搜索用例

机器学习 (ML) 搜索的应用是无限的,而且 Elastic 的各种功能推动了高度相关的搜索,从而增强了搜索体验和后台管理能力。

  • 个性化

    通过命名实体识别和文本分类,构建可针对最终用户位置、客户帐户或购买历史记录或他们在组织内角色进行响应的搜索体验。

  • 语义搜索

    借助自然语言搜索,可让用户大规模更快、更准确地获得结果。既可使用 Elastic 开箱即用型的模型,也可通过向量搜索和近似最近邻算法(捕捉上下文信息并解锁搜索 查询背后的含义)来构建。

  • 图像搜索

    跨大型数据集比较图像,以实现产品发现和交叉销售、图像跟踪和身份验证。

  • 问题回答

    通过使用向量字段和文本相似性搜索,在您的常见问答、帮助中心或支持知识库中查找类似问题,从而更快地为用户提供相关答案。当您使用 LLM 和生成式 AI 为新体验提供强大支持时,将您的专有数据关联起来,以获得更相关的输出。

  • 内容扩充

    通过命名实体识别、文本嵌入、零样本分类和情感分析来组织内容,以在您的网站上同时显示五星级客户评价或类似的新闻报道,对研究数据进行分类,或发送客户支持问题。

  • 趋势识别

    使用机器学习模型,通过对搜索分析和行为进行分类、聚类和关联,发现搜索数据中的模式并做出有效反应, 如内容或商品目录中的空白。

Elastic 的不同之处

化繁为简

Elastic 的工具为机器学习带来了集成、灵活性和可扩展性,团队可以轻松使用预训练模型并进行大规模操作。您可以对这些模型进行调优,也可以构建自己的模型,以满足特定领的需求,并为您的组织进行创新。

  • 内置机器学习

    通过核心 Elasticsearch 中内置的机器学习,可以高效整合您的数据,而无需将它们导出到外部终端。

  • 灵活的应用程序

    构建 AI 驱动的现代搜索,且具有超高的可配置性和易用性。将生成式 AI 与安全搜索私人数据存储相结合,在利用最新对话技术的同时,可确保信息的隐私性和准确性。

  • 可针对任何用例进行扩展

    测试、运营和扩展都与 Elasticsearch 风格保持一致。机器学习已经包含在您爱用的搜索平台中,而且这个平台还可为您的应用程序提供安全性和可观测性。