在Atlas中可视化Open AI嵌入
在这个例子中,我们将上传食品评论嵌入到Atlas中,以便可视化这些嵌入。
什么是Atlas?
Atlas是一个用于在您的Web浏览器中可视化大型嵌入式数据集的机器学习工具。将数百万个嵌入式数据上传到Atlas,并在您的Web浏览器或Jupyter笔记本中与其进行交互。
1. 登录到Atlas。
!pip install nomic
import pandas as pd
import numpy as np
from ast import literal_eval
# 加载嵌入向量
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)
# 转换为浮点数的列表列表
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #演示账户
data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
id_field='id',
colorable_fields=['Score'])
map = project.maps[0]
2. 在Jupyter中与您的嵌入进行交互
map
Project: meek-laborer
Projection ID: 463f4614-7689-47e4-b55b-1da0cc679559
Hide embedded project