FAQ
-
メディカルデータサイエンス実践力養成講座
< All Topics
Rによる統計学(入門編)
更新日2024年9月5日
Table of Contents
回答
置き換えるということができます。少しサンプルコードを書いてみましょう # まず分かりやすいように適当にデータフレームを作ります。 df <- data.frame(a = as.factor (c(1, 5, 7, 8)),b = c('A', 'B', 'C', 'D'), c = c(14, 14, 19, 22),d = c(3, 7, 14, 11)) # 内容を確認します。 df # 14となっているところを24に書き換えてみましょう # こうすると14という部分は3つ(C列とD列)ありますが、3つとも24に置き換わります。 df[df == 14] <- 24 # 最初のdfをもう一度コピペして、データフレームを作ってください。 #14を24に置き換えするときに、列を指定できます。ここではC列のみです df['c'][df['c'] == 14] <- 24 # 最初のdfをもう一度コピペして、データフレームを作ってください。 # 今度は14と19を24に書き換えてみましょう df[df == 14 | df == 19] <- 24 使い方は分かりましたでしょうか。 「消す」とおっしゃっていた部分ですが、データフレームは全ての値が入ってないと動きませんので、消すということは難しいです。できてNAに置き換えるとかでしょうか。
回答
そちらは日本語が文字化けしている状態かと思います。特にMacで見られることが多いようです。 その場合は、たとえば棒グラフなら(引数は省略しています)、ggplot()+geom_bar()としますよね? この後ろ、+geom_test()+theme_bw(base_family = “HiraKakuProN-W3”)をつけてみてください。 ggplot()+geom_bar()+geom_test()+theme_bw(base_family = “HiraKakuProN-W3”) とすると文字化けが収まるかもしれません。 ただ上記コマンドはもう古くなっていて、動かない可能性もあります。 Googleで「Mac R 文字化け」と調べると設定での変更方法も図入りで示しているサイトもあるので、ご自身のバージョンでも動くかお試しいただければ幸いです。
回答
クリップボードからのデータ読み込みエラーですが、同じくこちらもMacだけでときどきみられる「 incomplete final line」のエラーですね。いくつか対処方法がありますので、羅列いたします。
1.まず読み込むデータの数値部分を、セルの書式設定で数値にしっかりしてみてください。
2.「1」でダメだった場合、データの一番下の一行空白になっている行も含めてクリップボードにコピーしてみて読み込みしてみてください。
3.大体はなぜか「2」の空白行込みにしてコピーしたら動くのですが、もし「2」でダメならば、一旦メモ帳に張り付けて、UTF-8に変えてみてください。
4.「3」もダメだった場合は、「3」で作成したテキストを保存して、テキストファイルを読み込む形にし、クリップボードからの読み込みは無理かもしれません。
回答
現在のテキストファイルは、ANSIコードになっています。
WinでUTF8か16にもできますが、ANSIで文字化けしているならば、UTFでも恐らく文字化けするかと思います。
Mac側で設定しないとWin側で行うのは難しいです。
こちらにサイトがあります。
https://ameblo.jp/re-freckle/entry-12576531509.html
またはマックのサイトにも説明があります。
https://support.apple.com/ja-jp/guide/textedit/txted1028/mac
上述の通り、ご面倒ではありますが、Mac側でご対応いただかないと難しいかもしれません。
一応UTF-16を用意しておきましたので、お送りしますが、恐らく文字化けするかと思いますので、
上述のサイト、またはご面倒ではございますが、ご自身で検索して見やすいサイトを選んでいただき、
Macのテキストエディタのエンコーディングの設定をよろしくお願いいたします。
回答
特定の行抽出は、指定する行番号が明確なときには
変数をaとして説明すると
#1行目、3列目のデータを抽出
a[1,3]
#3行目を抽出
a[3,]
#3~5行目を抽出
a[3:5,]
このように選ぶこともできます。
またはfilter関数やselect関数などを使用することが多いように思います。
回答
はい、上書きされます。