python – Como usar KMeans com Sklearn para identificar doenças através de sintomas?


Criei um dataset utilizando o mongoDB no qual ficou da seguinte maneira:

    {
    "Nome":"Paciente 1",
    "Sintomas":("Febre","Dor de Cabeça", "Cansaço")
    }

Consegui puxar ele através do pandas, mas quando tento jogar os dados do dataframe no sklearn não da certo.

A variavel “df” esta retornando uma coluna com os pacientes, e outra coluna com o array dos sintomas.

kmeans = KMeans(n_clusters = 3, init = 'k-means++', max_iter = 300, n_init = 10)
clusters = kmeans.fit_predict(df)
clusters