有人能帮我做这个,并解释如何正确地标记,计数和循环吗?有这样的任务要做:
通过包含在dic = {}
COUNTER UNIQUE_TOKEN FREQUENCY NEWLINE -按唯一令牌的频率(进行排序。
*Text1 1来自nltkbook
到目前为止,我明白了,但奇怪的事情正在发生,我完全不明白我做了什么:
import nltk
from nltk.book import *
print(len(set(text1)))
counter = 0
for token in text1:
counter += 1
print(counter)会非常感谢任何帮助,线索,建议。
发布于 2020-11-15 13:27:42
例如,这是如何执行此操作的示例。
text = "to be or not to be"
token = ["to", "or"]
my_dict = {sub:text.count(sub) for sub in token}
print(my_dict)给你
{'to': 2, 'or': 1}https://stackoverflow.com/questions/64844857
复制相似问题