[博客翻译]不要随意使用余弦相似度 传说中,迈达斯国王触碰的一切都会变成黄金。而数据科学家则把一切都变成了向量。我们这么做是有原因的——正如黄金是商人的语言,向量则是人工智能的语言。然而,正如迈达斯发现把一切都变成黄金并不总是好事一样,盲目地使用余弦相似度来比较向量也可能会让我们误入歧途。虽然嵌入(embeddings)确实能捕捉到相似... 由 openoker发布于 2025-01-15 11:01:59 余弦相似度向量嵌入相似性机器学习 阅读次数 508
[博客翻译]Radient:数据转向器,让多种类型的数据融入相似搜索 Radient是一个轻量级且开发者友好的库,它能将各种数据类型(不只是文本)转换为向量,便于进行相似性搜索。在利用RAG(Retrieval-Augmented Generation)技术的应用中,向量数据库常被用来检索与查询相关的内容。随着大模态模型(如Reka和Fuyu)的发展以及推荐和语义搜索等传统任务的兴起,向量的应用范围正在扩大,不再局限于文本领域。 由 openoker发布于 2024-05-10 18:11:42 音频文本向量 阅读次数 958