我是Python的新手,最近学习使用Bag of Words和TFIDF进行文本处理.
我试图使用以下代码获取TFIDF中第1001列中的单词:
count_vectorizer = CountVectorizer()
bag_of_words = count_vectorizer.fit_transform(df)
TFIDF_transformer = TfidfTransformer(norm = 'l2')
TFIDF_representation = TFIDF_transformer.fit_transform(bag_of_words)
TFIDF_transformer.get_feature_names_out()[1000]
输出是"x1000",一个记号(我假设)而不是单词.
如何在TFIDF中获取第1001列中的确切单词?我是否使用了错误的函数或错过了其他步骤来解释我获得的 token ?