対応がない場合のt検定 参考文献は以下、 http://www012.upp.so-net.ne.jp/doi/biostat/CT39/ttest.pdf 二つのグループをt検定する。 まず前提として、二つのグループ等分散、母分散は不明であるとする。 等分散じゃないと、t検定が使えない。 二つのグルー…
以下で可能、 REPLACE(column名,"置換前の文字列","置換後の文字列") 条件が複数の場合は、 REPLACE(REPLACE(column名,"置換前の文字列","置換後の文字列"),"置換前の文字列","置換後の文字列") というように入れ子にする。 上記の方法だと、いちいちcolumn…
#エクセルを操作C#でエクセル操作をする. 開発環境は、Visual studio2017です。 エクセル操作のためのdllがあるんですが、 それはつかいませんでした。 今回は、NPOIというモジュール(?)を使います。 以下参考サイトです。 【C#】NPOIを使ってExcelファイル…
ソースコードのver管理をどうする? 以下、Sourcetree、Bitbucketの環境構築および使い方についてのメモです。 参考サイトは以下です。 【連載Git入門 第2回】SourceTreeでGitを始めよう!まずは試しに使ってみよう! | naichilab - Android iOSアプリ開発メ…
seabornのグラフを一度に複数書く、 あるパラメータで層別して、複数のグラフを一度に描きたいです。 seabornのfacetgridを使います。 参考サイトは以下です。 Python でデータ可視化 - "Facet"で属性別グラフを一気に描く方法が便利すぎる - Qiit…
よくわからないエラーがでました。 statsmodelsを再インストールしたら治りました。 以下、参考サイト https://qiita.com/currypurin/items/44ce22102af4eda45622
deming regression 回帰直線を引くときに、横軸にも誤差がある場合はdeming regressionという方法で 回帰直線をひく必要があります。 deming regressionとタイトルにありますが、 別名で直行回帰(Orthogonal distance regression)ともいうらしいです。 scipy…
ファイルを読み込む 空行があるファイルを読み込むときに、 ちょっとつまずいたのでメモります。 まずファイルの読み方ですが、以下を参考に、、、 Python: テキストファイルの読み込み - read()、readlines()、readline()メソッド | Yukun's Blogテキストフ…
ガウスフィット pythonでガウスフィットさせてその面積を求めるプログラムを作りたいです。 GUIで作りたい。ひとまず、必要な機能は、 ・matplotlibのグラフ上から、ポインタ情報を引っこ抜く ・ガウスフィットさせる あたりです。以下のサイトを参考にしま…
JSONファイル JSONファイルって何? 調べればすぐに出てきますけど(以下等参考)、 プログラムと人の両方が理解できる形式ってイメージです。 【Python入門】JSON形式データの扱い方 - Qiita 同じようなものにXMLとかあるけど、それよりも見やすい気がします…
動的に変数を作成 pythonでつまずいたことがあったのでメモfor文でloopさせて、動的に変数作成をしたかったんですよ。 その際に、引数もfor文で作成的なやつです。間違った例↓ for n in dataframe.colums "data_{}".format(n) = dateframe[n] これはダメでし…
はじめに 自分好みの補完機能が欲しくてVSCodeのインテリセンス機能を編集しました。 下記サイトを参考にしました。vscode-doc-jp.github.io実際にやったことは、 VSCodeをSQLエディタとして使う際、 テーブル名とカラム名の保管機能を追加しました。VScode…
APIからティッカー情報を引っ張ってくる 下記サイトを参考にして(というかそのまま)、さわりだけ勉強、 https://qiita.com/ti-ginkgo/items/7e15bdac6618c07534berequestsってライブラリは初めて使いました。 何するライブラリなの? 下記サイトを参考にさせ…
仮想通貨 世の中流行ってますね。 冬休みでまとまった時間があったので勉強してみました。 色んなブログやら書籍やらありますが、主に下記を読みました。 結構ボリュームがあるので、大枠しか読んでませんが、、、 わからないことは、いろいろググりながら読…
学習曲線 データセットに対してモデルが複雑すぎる場合、過学習する傾向があり汎化性能が落ちてしまう。 トレーニングデータをさらに集めると、過学習は抑えることができるが、データをさらに集めることはコストが非常に高い。 また、実はこれ以上データを集…
pythonスクリプトをexeにしたい pythonで作ったプログラムを他人に渡すときに、exeで渡したいんですよね。 インタプリタのインストールを強要したくないので。ちなみに、 自分のPCはOS Xで、渡す先はwindows 10という条件です。 monoをインストール exe化す…
k分割交差検証 前回までで、ランダムフォレストでモデル予測を実施しました。 今回は、k分割交差検証、グリッドサーチを用いてモデル性能の評価及びハイパーパラメータの修正を行います。 これにより、バイアス高、バリアンス高のバランスをとることができま…
決定木の可視化 決定木の利点としては、意味解釈可能性があります。 ランダムフォレストで作成された決定木を可視化して、その意味を解釈しようと思います。scikit-learnには、決定木を.dotファイルとしてエクスポートする機能があります。 その前に、.dotフ…
はじめに ランダムフォレストを使って、タイタニック号のデータをモデル化します。 ランダムフォレストって何? ランダムフォレストは、複数の決定木を組み合わせて、 各決定木における予想結果の多数決により、結果を得ます。アルゴリズムとしては、 1.ラン…
はじめに 機会学習のスキルを身に付けたく、kaggleに挑戦中です。 タイタニック号のデータを、ランダムフォレストでモデル化しました。 今回は、ランダムフォレストの基本となる決定木について書こうと思います。 簡単に自己紹介すると、僕は材料系メーカー…
よく使う言語は、VB(A)、C#、python、Rとか。 学生の時は、Fortran,Cとか使ってた。 流行りだからpythonのスキルを上げたい。 IDEはvisual studioを使ってたけど、 pycharmに乗り換えて(python限定だけど)みる。 visual studioは重い気がして好きになれない…
windows だと画面のリサイズが結構簡単。 「windowsキー」+「矢印」で色々できる。 職場のPCはwindowsだから、macでもやりたい。 探してみたら「Spectacle」ってやつで可能みたい。 インストールしたら、 「opt」+「command」+「矢印」でリサイズができるよ…
回路図作成のため、Eaglesを使ってみた。 いくつかあるCADソフトの中で、Eaglesにした理由は、 OS X,Windows両方に対応しているという点のみ。 以下、忘備録として ・プロジェクトの新規作成 Projects/eagle 右クリックでnew project プロジェクト名は日本語…
excel,csvファイルの読み込み pandasのread_excelを使うと簡単、 エクセルデータを読み込んで、データフレーム にしてくれる。 やりたいこと あるディレクトリにある大量のエクセル(もしくはcsv)ファイルすべてから、 n行m列からk列までのデータを引っ張っ…