跳到主要内容

在Atlas中可视化Open AI嵌入

nbviewer

在这个例子中,我们将上传食品评论嵌入到Atlas中,以便可视化这些嵌入。

什么是Atlas?

Atlas是一个用于在您的Web浏览器中可视化大型嵌入式数据集的机器学习工具。将数百万个嵌入式数据上传到Atlas,并在您的Web浏览器或Jupyter笔记本中与其进行交互。

1. 登录到Atlas。

!pip install nomic

import pandas as pd
import numpy as np
from ast import literal_eval

# 加载嵌入向量
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)

# 转换为浮点数的列表列表
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})


import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #演示账户

data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
id_field='id',
colorable_fields=['Score'])
map = project.maps[0]

2. 在Jupyter中与您的嵌入进行交互

map

Project: meek-laborer

Projection ID: 463f4614-7689-47e4-b55b-1da0cc679559

Hide embedded project