超初心者向けのRガイド
textファイル,text editor,csvファイル
1 全体の構成
- a. 基本演算とヴェクトル・行列,データ・フレイムの作成
- b. 確率分布を読み取ったりグラフに描いたりする方法
- c. 欠損値,変数のリコード
- d. 一つのカテゴリカル変数の度数分布表
- e. 多項選択回答の表の作成
- f. 分割表(クロス表)の作成
- g. 各種グラフの雛形
- DAG. 有向非巡回グラフ
- QCA. 定性的比較分析
- TXT. text file, ext editor, csv file
2 テキスト・ファイル
- テキスト形式ファイル(テキスト・ファイル,プレーン・テキストPlane Text)とは,純粋に文字・記号だけからなるファイルの事で,拡張子(extension)は通常 “.txt” である。
- コンピュータ・ファイルのファイル名は,通常,filenameとextensionをピリオドで繋いで構成される。例えば,practice.csv の様に。
- 拡張子は半角英数3字か4字からなるのが一般的で,代表的なものは,.docx(MS Word),.xlsx(MS Excel),.exe(実行ファイル),.pdf(portable document format),.jpg(JPEG形式の画像ファイル),.txt(テキストファイル),.html(通常のWebページ)などである。
- Windowsは,本来存在している拡張子をデフォルトでは表示しない事が有るので神経を疑う。自分で設定項目を見つけ出して設定変更して常時表示させる必要がある。
- テキストファイルの中には,多少の装飾などを用いる事が出来るリッチ・テキスト・ファイル(.rtf)と云うものもあるが,ここではrich text形式はtext形式に含めない。
2.1 Microsoft Wordファイルなどとの違い
- MS Wordなどのワードプロセッサでは,文字のサイズや種類,文字の色,太字や斜体,カラーマーカー,下線や抹消線,罫線,図表の挿入など様々な装飾を施して保存する事が出来るが,txtファイルは文字・記号そのものの情報以外は使用・保存できない。 ― テキストファイルで用いる事が出来るのは文字・数字・記号であり(以下が主なリスト),半角(1 byte 文字)だけでなく全角(2 byte文字)も用いることができるが,文字コードの存在には注意が必要である。
- 半角と全角の英字(大文字,小文字)
- 半角と全角のアラビア数字,全角のローマ数字(全角文字扱い)
- 半角と全角の記号(基本はキーボードから直接入力できるもの)
- 全角のひらがな,カタカナ,漢字
- 半角のカタカナも可能だが,余り推奨しない
- Wordでもtxtファイルの編集は可能だが,以下の理由から推奨しない。
- WordもExcelも文字コードの違いに対応していない(多分)。
- テキストファイルには不要・不適な装飾・機能が多く意図せずそうした書式を適用してきて非常にうざい。
- 他方で,テキストを扱う際に重要な機能(特に検索や置換)がWordにはなかったり貧弱だったりする。
- テキストエディタは大抵の文字コードに当たり前に対応している。 ― 何よりテキストエディタの方が動作が遥かに軽快である。
2.2 テキストエディタ
ウェブ上に高性能なフリーのテキストエディタはたくさん存在するので,自分に使い易いものを見つけてテキストファイルの編集に常用するのが良い。
- Windows用の老舗のフリーソフト提供サイト「窓の杜」のテキストエディタ部門
- はじめての人にはMery辺りが使い易いのでは。
- MacOS用テキストエディタのお勧めサイト一例
- 個人的にはCotEditorが初心者向きだと思う。
2.3 文字コードに起因する問題
- 文字コード(非常によくある問題): UTF-8(BOMなし)かshift-jisか
- InternetやMacの世界では前者UTF-8が標準だが,MS Officeは後者を標準とし,前者に対応していない(多分)。
- この事を知らない人が,「文字化け」に遭遇して混乱・困惑する。
- 少なくともテキスト形式ファイル(*.txt, *.csvなど)は,無料のテキスト専用エディタやcsvエディタを使用するのが望ましい。
3 csvファイル
csv(comma separated values)形式ファイルは,特殊な形式のテキストファイルであるので,通常のテキストエディタでも編集可能であるが,csvファイル専用のcsvエディタもフリーで存在している。
3.1 Microsoft Excelファイルとの違い
Windowsが通常デフォルトでcsvファイルをMicrosoft Excelに関連付けしている所為で,Windowsでcsvファイルを開こうとするとExcelで開く事が多いと推測するが,本来はExcel形式・Excelファイルではなく,もっと汎用的な形式である。これは是非知っておいた方が良い。
既に別のページで説明しているので,以下のリンクからそちらを参照して欲しい。
3.2 csvエディタ
わざわざ重たくて有料のExcelを立ち上げなくても,軽快に動作するcsv専用エディタで編集する方がずっと賢明である。
特にExcelはUTF-8の文字コードのcsvを開くと文字化けするが,今やインターネット上で入手できるcsvファイルの多くはUTF-8である。