準備2・漢字画数データ取得

漢字画数データベースから取得
  • UTF-8SJISだと読めない?変換が必要?
    • rawデータコピペでなんとか・・・
    • 一部、日本語文化圏で使ってないような奴が読めてなかった模様
    • 読めてるけど画数が空のやつとか結構ある(画数は重要ではないけど、どうするかな)
  • とりあえず、TAB区切りをExcelに移して文字化けてるもの(「?」)を削除(多分8割ぐらいカットした)
    • コメント行っぽいのも削除
データストアにインポート
  • 画数にカンマ「,」入ってるのがよくない
    • 出力時に"で括ってはくれてるけど数値で統一したい(使うことはないはずだけども)
    • 少ない方で統一するか、平均値にしてぶっこむか
    • 使わないなら元データで入れておくのがベストか・・・
  • 突っ込んでみたが画数しか入らない・・・
    • ""で囲まないと文字列と認識されない?そこか?