国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現統計單詞出現的個數

2020-02-23 01:26:31
字體:
來源:轉載
供稿:網友

最近在看python腳本語言,腳本語言是一種解釋性的語言,不需要編譯,可以直接用,由解釋器來負責解釋。python語言很強大,而且寫起來很簡潔。下面的一個例子就是用python統計單詞出現的個數。

import sysimport string#import collectionsif len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}: print("usage: uniqueword filename_1 filename_2 ... filename_n") sys.exit()else: words = {}  # words = collections.defaultdict(int) strip = string.whitespace + string.punctuation + string.digits + "/"'" for filename in sys.argv[1:]: for line in open(filename):  for word in line.split():  word = word.strip(strip)  if len(word) >= 2:   words[word] = words.get(word, 0) + 1   # words[word] += 1 for word in sorted(words): print("'{0}' occurs {1} times".format(word,words[word]))

假設文件名是 uniqueword.py,在命令行下輸入: uniqueword.py filename_1 filename_2 ... filename_n中單詞出現的次數可以被統計出來。
 
第四行和第五行判斷是否有輸入參數,如果輸入參數為空或者為-h, -help,則輸出幫助信息。

從第七行到第14行是核心部分,逐一打開參數中指定的文件,并讀取每一行,再用字符串的split方法把讀取的行抽取出一個一個的單詞,但單詞長度大于2的時候,把此單詞加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key為空,則把value置為默認值0. 最后打印出結果。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 舟山市| 崇仁县| 同江市| 博白县| 泸西县| 青冈县| 安岳县| 图们市| 鄢陵县| 德化县| 安西县| 德安县| 浙江省| 鹿邑县| 清新县| 托克逊县| 宜黄县| 兴安盟| 思茅市| 东乡县| 越西县| 北海市| 温州市| 沁水县| 马山县| 新疆| 望都县| 塘沽区| 海丰县| 东兴市| 简阳市| 即墨市| 闵行区| 白水县| 灵丘县| 宁都县| 揭西县| 沙洋县| 金秀| 黑龙江省| 印江|