mocchaso note

サーバーエンジニアが何か色々呟いているところ。

2020-07-12から1日間の記事一覧

言語処理100本ノック 2020「39. Zipfの法則」

Zipfの法則とは...? ja.wikipedia.org 平たく言うと、「出現頻度が多ければ、全体での割合が大きい」ということらしい。 言語処理100本ノック-39(pandas使用):Zipfの法則 - Qiita

言語処理100本ノック 2020「36. 頻度上位10語」

※棒グラフの描き方 matplotlib で棒グラフを描く – Python でデータサイエンス Matplotlibで日本語を表示 設定していないと、↓のように出力されて、豆腐化文字化けする。 /home/mocchaso/anaconda3/envs/develop/lib/python3.7/site-packages/matplotlib/bac…

言語処理100本ノック 2020「30. 形態素解析結果の読み込み」

空文字に対してsplitを適用するとどうなる? 配列に空文字列が1つ入る。 >>> "".split(",") [''] ※分割パターンを指定しないと、何故か空のリストになる。 >>> "".split() [] ※分割パターンが空文字だとエラーに。 >>> "abc".split("") Traceback (most rece…