今週のQiita技術書まとめ
2023年8月20日配信
凝集度とカプセル化
凝集度とは? 凝集度とは、ソフトウェア工学や情報科学などの分野で使われる概念。 プログラムやシステム内のモジュールやコンポーネントがどれだけ関連して一緒に動作しているかを表す尺度。 一般に凝集度は高ければ高いほど良い、逆に低いと良くないとされている。 低凝集な実装とは?
現場で役立つシステム設計の原則
日本最大級となる60万件以上の求人情報サイト「イーキャリアJobSearch」の主任設計者ほか数多くの経験を持つ著者が「現場でこんなことに困っていた」「解決策としてこうやった」「その結果こうなった」というリアルな経験と「なぜ、そうするのか」をふまえて解説!
生物系のためのR超入門 (10) 【2群間の平均値の差の検定:t 検定、ウィルコクソンの符号付順位検定と順位和検定】
0. はじめに 「トウモロコシ'A'品種と'B'品種の収量はどちらが多いのだろう?」 「薬剤X投与前後でマウスの血圧は変化しただろうか?」 などなど、2群間の平均値の差を検定したい場面はたくさんあると思います。 本記事では、2群間の平均値の差の検定の中から、t検定(対応のあるt 検定、Studentのt 検定、Welchのt検定)、ウィルコクソンの符号付順位検定と順位和検定の検定について、Rではど…
生物統計学
1.データの表示と要約統計量/2.統計的推測の基本/3.代表的な分布/4.二つの平均値の比較/5.区間推定/6.実験計画/7.分散分析/8.相関と回帰/9.分割表と独立性の検定/10.比率に関する推測/11.ノンパラメトリック法/12.統計処理アプリケーションウェア/13.線形モデル/14.生物学的応用
2023年版データ分析の100冊
わ、去年2023-08-26にこの記事書いたんだね。まる1年だね。2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊( 【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本( - 本記事のめあて - IT系の技術者の方がデータ分析関連の仕事をするために役立つ本を紹介する(私が学び始めた時にあれば欣喜雀躍したであろう)記…
AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
データサイエンティストと呼ばれる職種が登場して、いまや10年以上が経過しようとしています。ビッグデータやディープラーニングなど技術的な流行も後押しして、AI・データ分析プロジェクトに取り組む企業も増えました。また、データサイエンス、データエンジニアリングに関する技術情報は次第に増え、データ分析コンペティションの盛り上がりもあって技術的な知識を持つ方が増えているのは事実です。ところが、実際にAI・データ分析プロジェクトに取り組んでみると、そううまくはいかないようです。プロジェクトを進めるには技術知識だけでなく「ビジネス力」が必要なのです。 そこで、本書はこれまでメインテーマとして語られるこ...
仕事ではじめる機械学習 第2版
大好評の機械学習実務者向け書籍が最新情報にアップデート! 2018年に発行された初版から3年ぶりの改訂となる本書は、「仕事で機械学習に携わる際に知っておきたい事」を伝えるというコンセプトはそのままに、3年の間に登場した新たな考え方、手法など最新の情報を踏まえて内容を全面的に見直しました。これまで同様、機械学習を使った実務に初めて関わる読者にとって頼りになる1冊となるでしょう。「バンディットアルゴリズム」を紹介する新章など、追加原稿も多数。
分析者のためのデータ解釈学入門 データの本質をとらえる技術
本書は,データを分析して背後にあるメカニズムを解釈したり,データに基づいた意思決定や問題解決を行う際に,分析者が知っておかなければならない知識をわかりやすく網羅的に解説した教科書です。データ分析が上手くいくかどうかは,分析手法の技術だけでなく,データの質や扱い方,解釈の方法にも大きく影響を受けます。しかし,実践的にデータや分析の質を高く保ち,間違った解釈をしないための知識について,わかりやすくまとまった入門書はまだまだ少ないのが現状です。 本書では,各種分析手法をただ網羅するだけでなく,データのばらつきやバイアスに関する基礎知識,データにさまざまな偏りを生じさせる行動心理学,サンプリ...
データ分析失敗事例集
【データサイエンティストたちの悪夢】 ・上司が「AI使ってます」と言いたいだけのプロジェクト ・自分が期待した結果しか認めないクライアント ・プロジェクト終盤でもまだ手に入らないデータ ・分析手法にしか興味がない分析者 ・最終報告後にやっと決まる仕様 【その分析、もう失敗しているかも…… 失敗を回避し、成功に近づくためのガイド】 本書は、第一線で活躍するデータサイエンティストたちが経験した、データ分析プロジェクトの「失敗」をもとに再構成された25の事例が収録されている。これらの臨場感あふれる事例から、データの活用に関わる人たちが、失敗を避けるために何をしてはならないのか、につい...
データ分析・AIを実務に活かす データドリブン思考
データ収集システムやAI専門家が優秀でも、それだけではビジネスには勝てない。第一人者がデータドリブン思考の重要性を示す
世界標準のデータ戦略完全ガイド データセンスを磨く事例から、データの種類と仕組み、戦略策定のステップまで
本書ではデータ戦略の6つの目的と、そのためのデータ活用法をふんだんな事例を交えながら解説します。そのうえでアイスクリーム店を例にデータ戦略を考えることで、戦略の基本から策定、実践方法まで一気に学べます。AI(機械学習など)の仕組みや、インサイトの見いだし方、データインフラの整備、データ能力の高い組織のつくり方までしっかりフォロー。近年はデータ収集や活用のためのサービスが数えきれないほどありますが、それはどんな企業でも世界レベルのデータ戦略が実現可能であることを意味しています。世界の一流企業を導いてきた著者が、一気に世界レベルに駆け上がりたいすべての企業に贈る一冊です。
なぜ「戦略」で差がつくのか。
各社でマーケティング部門を育成・指揮してきた著者が初めて明かす!2つの要素さえ押さえれば、あなたは戦略を使いこなせる。
DX時代のデータマネジメント大全 DX、データドリブン経営、データ利活用から理解する
なぜDXが進まないのか、その理由と対策がわかる。外資系コンサルが体系的に解き明かす。DXはシステムを入れて終わりではなく、継続的なものでなければなりません。いくら投資しても継続的に運用できなければ、その効果は得られません。そのためには、まずDXにおける自社の現在地を認識し、設定したゴールまでの道筋を作る必要があります。本書は、そのために必要なデータマネジメントの知識を体系的にまとめた入門書です。DXにおけるデータドリブン経営の本質、データの利活用、そしてデータマネジメントの戦略からアーキテクチャ、品質管理、セキュリティといった構成要素まで、データマネジメントの全体像がつかめます。難しい専...
欠測データ処理
一般的に調査・観測データには欠測が生じることが多く,適切な欠測データの処理をしなければ,解析結果に偏りが生じることがある。多重代入法は,尤度解析法と並んで最も汎用的な欠測データ解析法であるが,これまでの書籍では理論的な解説が主で,実際の応用事例や具体的な手順の記述が少なかった。そのため,実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。 本書は,ワンポイントとして代入法を中心に解説している。平均値のt検定,重回帰分析,ロジスティック回帰分析,時系列分析,パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して,データに欠測が生じている...
機械学習のための特徴量エンジニアリング
機械学習や人工知能の性能を決める特徴量作成・変換/選択について詳述した書籍! 本書は、機械学習を行うエンジニアが知るべき特徴量抽出の基本から応用、最新のテーマまでを網羅した書籍です。内容としてはそれほど難しくないため、機械学習を学んでいる人が特徴量エンジニアリングについて学びはじめる書籍として最適です。
Kaggleで勝つデータ分析の技術
データサイエンスの認知の高まりとともに、データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え、多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは、実際のデータを扱うため、機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく、実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最...
サンプルサイズの決め方
本書では、入門的ないしは中級的な内容の統計的方法を勉強した読者を想定し、サンプルサイズ(標本数)の決め方(サンプルサイズの設計方法)を解説する。主に統計的検定における検出力に基づくサンプルサイズの設計方法を説明し、区間推定に基づくサンプルサイズの設計方法についても触れる。本書では、入門的な統計的方法の教科書で登場する一通りの手法を取り扱う。
データサイエンティストのための特徴量エンジニアリング
機械学習においてはモデルを作成しデータを与えて学習させますが、その前に生データをモデルが理解できるような形式に変換する「特徴量エンジニアリング」と呼ばる重要なステップがあります。データサイエンティストはモデルの学習に使用する生データを選び特徴量に変換したり、データを組み合わせ新しい特徴量を作成します。うまく設計された特徴量は、機械学習モデルの精度を大幅に向上させ、学習にかかる時間を短縮することができます。 本書は特徴量エンジニアリングの実践的なガイドであり、機械学習のための特徴量を作成するための効果的なテクニックとベストプラクティスを学ぶことができます。Pythonを活用し、70以上の...
基礎から学ぶ統計学
「統計学を理解したい」と真面目に考える人へ.統計がわからない. . .と挫折したことがある人へ. 10年を越える学生との試行錯誤が生んだ,学部を問わない“統計学の基礎”が身につく,新しい入門書. ▽3つの特色 ●図を多用する ●実践的な手法を中心に学ぶ ●数学のハードルを下げる 3つの特色と講義経験に基づく構成・展開で,初学者のつまずくポイントに,ていねいに伴走します. ▽扱う範囲 ●t検定 ●分散分析 ●多重比較 ●相関分析 ●単回帰分析 など,仮説検定の論理,母平均に対する統計解析,2変数の関係までを扱い,基本的な統計手法の計算の原理を,直感で,しっかり理解できるところまで導...
データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅
統計学の本質を知らずに分析してませんか?統計モデルから機械学習モデル、数理モデルまで。データ分析に取り組む前に学ぶべき統計学を1冊に凝縮!基礎から発展的手法まで全く新しい教科書!
新版 統計学のセンス
好評の旧版に加筆・アップデート。データを見る目を磨き,センスある研究を遂行するために。〔内容〕randomness/統計学的推測の意味/研究デザイン/統計解析以前のデータを見る目/平均値の比較/頻度の比較/イベント発生までの時間の比較
バイオサイエンスの統計学
バイオサイエンス領域でよく用いられる検定法を中心に解説.身近な数値や誤用例を通し,統計の基本概念からその正しい使い方まで,ひとりでに理解できる.カラー図式やコンピュータシミュレーション,漫画を駆使したビジュアルで楽しい編成.項目ごとに難易度,重要性が段階表示され,初学者から高度な読者までレベルに応じた読み方ができる. 序説 統計学とは 1. 検定の原理 2. 関連2群の差の検定 3. 独立2群の差の検定 4. 計数値データの検定 5. 独立多群の差の検定 6. 関連多群の差の検定 7. 回帰と相関 8. 標本の分布型とその検定法 9. 統計の正しい利用と解釈
見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑
機械学習アルゴリズムの違いが見てわかる! 「機械学習アルゴリズムは種類が多く、複雑で何をしているのかわかりにくい」と思ったこと、ありませんか?本書は、そのような機械学習アルゴリズムをオールカラーの図を用いて解説した機械学習の入門書です。 いままで複雑でわかりにくかった機械学習アルゴリズムを図解し、わかりやすく解説しています。アルゴリズムごとに項目を立てているので、どのアルゴリズムがどのような仕組みで動いているのか比較をしやすくしています。 これから機械学習を勉強する方だけでなく、実際に機械学習を業務で使用している方にも新しい気付きを得られるのでお勧めの1冊です。 【本書の特徴】...
本質を捉えたデータ分析のための分析モデル入門 統計モデル、深層学習、強化学習等 用途・特徴から原理まで一気通貫!
そのモデル、本質を理解して使ってますか?データ分析者必読の全く新しい教科書!実戦で頻出するデータ形式への対応に必須の分析モデル群について網羅的に解説!
はじめてのパターン認識
パターン認識にはじめて触れる読者に向け,基礎からわかりやすく解説した入門書です.パターン認識の概念がよく理解できるとともに,Rによる実行例など,実際に応用する際にも役立つ内容が盛り込まれています. 第1章 はじめに 第2章 識別規則と学習法の概要 第3章 ベイズの識別規則 第4章 確率モデルと識別関数 第5章 k最近傍法(kNN法) 第6章 線形識別関数 第7章 パーセプトロン型学習規則 第8章 サポートベクトルマシン 第9章 部分空間法 第10章 クラスタリング 第11章 識別器の組み合わせによる性能強化
Pythonではじめる教師なし学習
機械学習の手法の1つ、教師なし学習に絞って解説した実践書! 教師なし学習は、大きく3つに分類される機械学習の手法のうちの1つ。従来は、教師あり学習が主流でしたが、これからのデータ分析の形を考えると、教師なし学習も大きな一角を占めていくと考えられています。本書では、実践的な視点で、データ内に隠れている見つけにくいパターンを特定し、異常を検出し、自動的に特徴量抽出と選択を行っていきます。さらには、異なる機械学習手法の長所と短所を比較し、データに最適な手法の選び方についても、示していきます。
Optunaによるブラックボックス最適化
チューニングを自動化するブラックボックス最適化について詳説 本書は、機械学習に欠かせないハイパーパラメータ調整(チューニング)を自動化するブラックボックス最適化について一からわかりやすく、そして、詳しく説明した書籍です。合わせて、Python言語上で動作するフレームワーク“Optuna”によるブラックボックス最適化の実行を、Optunaの開発者ら自ら詳しく説明しており、基礎を理解しながら実践に即した知識を身につけることができます。 いまや機械学習は多種多様な応用が広く図られており、技術者/研究者、学生全般にとって必修といえるスキルになっていますが、その際に手間を要するのが、ハイパーパラ...
パターン認識と機械学習 上
2006年出版以来、amazon.comの人工知能部門で世界的トップセラーとなり、たちまち4刷となった英語版原著Pattern Recognition and Machine Learning、待望の日本語版。5名の監訳者のもと、選りすぐられた日本人研究者達14名によって丁寧に訳出。ベイズ理論に基づいた統一的な視点から、機械学習とパターン認識の様々な理論や手法を解説。
パターン認識と機械学習 下
ベイズ理論に基づく統計的予測技術は、計算アルゴリズムの開発と計算機の性能向上により、近年、急速に進展してきた。本書は、このベイズ理論に基づいた統一的な視点から、機械学習とパターン認識の様々な理論や手法を解説した教科書。この下巻では上巻の基礎的な話題を発展させた様々な手法を扱う。まず、予測精度の高さで注目を集めたサポートベクトルマシンと、今や幅広い領域で使われているカーネル法を説明。次に高度な確率モデルを表現するベイジアンネットなどのグラフィカルモデルや、潜在変数を扱うEMアルゴリズムを紹介。その後、ベイズ理論の適用範囲を広げた変分ベイズ法とMCMC法について触れ、次元削減や時系列の扱いと...
Python機械学習プログラミング PyTorch&scikit-learn編
本書は、機械学習の手法全般をカバーし、理論的背景とPythonコーディングの実際を解説。一から実装することでモデルの仕組みをより具体的に理解でき、PyTorchやscikit-learnのライブラリを使うことでより簡単に実装できることを示します。PyTorchについてはその仕組みから説き、自然言語処理やグラフニューラルネットワークなどの実装を解説。機械学習の理論と実践について幅広く探求するための一冊となっています。
ディープラーニングを支える技術 --「正解」を導くメカニズム[技術基礎]
初学者の方々に向けた、ディープラーニングの技術解説書。 2012年に一般画像分類コンテスト(ILSVRC)で衝撃的な性能を達成したAlexNetの登場以来、急速な進化を遂げているディープラーニング。現在の人工知能/AIの発展の中核を担っており、スマートフォンからIoT、クラウドに至るまで幅広い領域で、画像、音声、言語処理をはじめとした多くの対象分野に浸透し、目覚ましい進展をもたらしています。一方、その成長の過程は決して一筋縄ではなく、無数の試行錯誤がありました。 本書では、ディープラーニングの「今」に焦点を当て、「基本機能」を中核に技術面から可能な限り正確にまとめ、どのようなしくみで動い...
ディープラーニングを支える技術〈2〉 --ニューラルネットワーク最大の謎
初学者の方々に向け、ディープラーニングの発展技術をまとめた解説書。 ディープラーニングは現在のAI/人工知能の発展の中核を担っており、スマートフォンからIoT、クラウドに至るまで幅広い領域で、画像、音声、言語処理をはじめとした多くの対象分野に浸透し、目覚ましい進展をもたらしています。 ディープラーニングの今の基本をまとめた前作に続き、本作ではニューラルネットワークにおける大きな謎である「なぜ学習できるのか」「なぜ汎化するのか」にスポットを当て平易に解説。合わせて、将来的な革新の可能性を秘める二大トピックとして、「生成モデル」「深層強化学習」も詳しく取り上げます。そして、4つのテーマのもと...
ゼロから作るDeep Learning
実際にシステムを作りながらディープラーニングを学ぶ! ディープラーニングの本格的な入門書。外部のライブラリに頼らずに、Python 3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。ディープラーニングやニューラルネットワークの基礎だけでなく、誤差逆伝播法や畳み込みニューラルネットワークなども実装レベルで理解できます。ハイパーパラメータの決め方や重みの初期値といった実践的なテクニック、Batch NormalizationやDropout、Adamといった最近のトレンド、自動運転や画像生成、強化学習などの応用例、さらには、なぜディープラーニングは優...
深層学習 改訂第2版
◆ベストセラーの改訂版。最高最強のバイブルが大幅にパワーアップ!!◆ ・トランスフォーマー、グラフニューラルネットワーク、生成モデルなどをはじめ、各手法を大幅に加筆。 ・深層学習のさまざまな課題と、その対策についても詳しく解説。 [本書まえがきより抜粋] ないもの(=理論)ねだりをしても仕方がありません.それでも皆が研究を進めるのは,そうすることに意義があるからです.なぜうまく働くのか,なぜそうすべきか,数学的な証明はなくても,正しい説明は必ずあるはずです.それを手にできれば,目の前の課題を解決するのに,また次に進むべき道を知るうえで役に立つでしょう. そこで本書では,それぞれの方法...
AI技術の最前線 これからのAIを読み解く先端技術73
世界のAI技術の今を“手加減なし"で執筆! ディープラーニングを中心としたAI技術の真髄を説く本気の解説書 日本を代表するAIベンチャーの共同創業者が7年間にわたり、第一線のエンジニア向けに手加減なしで書き続けた『日経Robotics』誌のAI解説人気連載が待望の書籍化。次々と常識が書き換わり続けるAI技術が今後どうなっていくのか。その将来を占う最先端技術を、73のテーマで解説します。 学習の仕組み、各種モデル・アーキテクチャ、そして各種アプリケーションまで網羅的に解説。この1冊を読めば、今、世界のAI技術がどのようになっているのか、世界の先端企業や研究者がAI技術の謎をどのように解明...
創るためのAI
Artificial Intelligence(AI)=人工知能を用いたアートや音楽など創作に関する取り組みを題材に、人間の創造性とAIの関係、その未来像について考察した一冊。 社会における注目度が急速に増し、日常の何気ない会話の中にも登場するほど、私たちの生活に浸透しつつあるAI。一方で、AIの実像について理解できている人はそう多くありません。「近いうちにAIが人間の能力を凌駕する」、「AIが仕事を奪う」といった話がマスメディアでまことしやかに囁かれ、「AI時代」を生き抜くために必要な能力を議論する書籍をよく目にするようになりました。機械的な計算を超人的なスピードと正確性でこなすAI...
はじめてのパターン認識 ディープラーニング編
あの『はじめてのパターン認識』著者が徹底解説! ディープラーニングの理論的基礎がよくわかる! 機械学習の基礎的な理論について,幅広く解説した前著『はじパタ』.それとほぼ同時期に登場したディープラーニングは,いまや当然の技術として,様々な分野で活用されるようになりました. いまこそ,ディープラーニングの要素技術とその応用展開について理解を深め,確かな実力を身につけていきましょう. なぜディープラーニングはうまくいくのか? ブレイクスルーの要因はどこにあるのか? ディープラーニングを開花させたここ10年の様々な研究成果を網羅的に概観しつつ,ディープラーニングの中枢を担う原理を掘り下げて...
評価指標入門〜データサイエンスとビジネスをつなぐ架け橋
「評価指標でXXXという最高のスコアが出た!」と喜び勇んで、機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが、ビジネス上のKPIと相関が高い評価指標を選んでいなかったために、KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして、特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが、KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは、データサイエンティストが費やした工数がすべて水の泡となってしまいます。-...
XAI(説明可能なAI)--そのとき人工知能はどう考えたのか?
◆AIの説明責任を果たす ◆ ◆◆手法とツールを解説◆◆ AIが出した答について「なぜ?」「どうして、そうなるの?」と問われた開発者は、絶句するほかありません。そこを機械に任せるための機械学習なのですから、「黙って信じてください」と頼みますか? この難問に対し、人間が納得できそうな理由や根拠を示す技術が「説明可能なAI」(eXplainable AI:XAI)です。本書では、実際にどのような「説明」が必要とされ、また、可能なのかを丁寧に解説。代表的なXAI技術の概要を紹介し、PythonのXAIライブラリLIMEやSHAP等の使いこなしを手引き。AIの業務適用で迫られる「公平性・説明...
機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
機械学習の研究開発が急速な勢いで進んでいます。理論研究はもちろん、機械学習手法が実装されたオープンソースのパッケージ開発も進み、それらを実務で利用するためのノウハウも蓄積されてきています。結果として、機械学習をはじめたばかりの入門者でも比較的高い精度の予測モデルを構築できるようになりました。 Deep Learning, Gradient Boosting Decision Tree, Random Forestなどの機械学習モデルは高い予測精度を誇りますが、モデルの解釈性が低いという欠点があります。これらの複雑なブラックボックスモデルにおいて、モデルがなぜそのような予測を行っているのか...
実践XAI[説明可能なAI] 機械学習の予測を説明するためのPythonコーディング
ビジネス上の意思決定につながる機械学習の予測には、解釈・説明が求められます。そこで、そうした解釈・説明を行うための手法を紹介します。実際にLIME、SHAP、Skater、ELI5といった種々のPythonライブラリを使い、モデルがなぜそのように予測するのかを探っていきます。予測モデルとして、線形・非線形モデルのほか、アンサンブルモデル、時系列モデル、自然言語処理、ディープラーニング、コンピュータビジョンを取り上げます。本書は解釈・説明のための方法を包括的に取り上げており、機械学習を実際の現場で活用する方にぜひ手に取っていただきたい一冊です。
データ視覚化のデザイン
達人が教えるビジュアライゼーションの極意!! 本書で言う「データ視覚化」(ビジュアライゼーション)とは、単に手元にあるデータをグラフにすることではありません。いくらデータを視覚化しても、その中から人間が重要な情報を読み取れないのなら、データ視覚化をする意味がないからです。 あくまで、そのデータが指し示す意味を明確にすること、そしてより多くの人たち(オーディエンス)に興味を持って見てももらえることがデータ視覚化の目的です。 本書では、日本人女性唯一のTableau ZEN MASTERである筆者が長年にわたって培ってきたデータ視覚化のノウハウ、ベストプラクティス、アンチパターン等を整...
フィナンシャル・タイムズ式 図解の技術
データが氾濫するこの現代、文字だけでは伝わらない複雑な背景知識をどう伝えればいいか? 世界最高峰の経済紙『ファイナンシャル・タイムズ』で開発された図解のノウハウをあますところなく紹介。70を超える見本に当てはめるだけで、誰もが簡単に誤解なく伝わる図表を作成できる。ポスト真実時代の新しい図解の教科書。
DataStory
データで相手の行動を変える手法がついに明らかに! 現代社会において、ほとんどすべての人が意思決定のためにデータを利用しています。会社の報告会で、学校のレポート作成で、家庭の家計簿で…データが関わらない場面はないといってもよいでしょう。しかしながら、データからわかったことを、他人に短時間でうまく伝えるのは実に難しいことです。 もし、データから重大な問題や絶好の機会を見つけたとしたら、どうしますか? どのように洞察を伝えますか? 本書では、相手に行動を起こさせるためのデータの効果的な伝え方を解説しています。具体的には、次のようなことを学ぶことができます。 ・「共感」というレンズを通して...
ハーバード・ビジネス・レビュー流 データビジュアライゼーション
『ハーバード・ビジネス・レビュー』のシニアエディターが、持てる知識とノウハウをすべて詰め込んだデータビズ決定版!
データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法
分析したデータを わかりやすく ビジュアライゼーションしよう! 【データビジュアライゼーションとは】 数値データ・位置のデータ・文章のデータ等を、 一目で分かりやすく見える形にする方法です。 【背景】 ビッグデータやAIという言葉が流行して以降、 様々な組織でデータを活用しようという動きがみられます。 データの活用のためには、私たち人間がデータの内容をよく理解する必要があり、 そのためにビジュアライゼーションはとても有効な手段です。 Pythonにはデータビジュアライゼーションに特化したライブラリがそろっており、 利用するデータ分析者も増えています。 一方で、 「どのような場合...
ビジネスダッシュボード 設計・実装ガイドブック 成果を生み出すデータと分析のデザイン
データドリブンな意思決定を促す強力なツールの作り方を紹介!
AIエンジニアのための機械学習システムデザインパターン
機械学習システム構築に必要な デザインパターンがここにある! 【本書の背景】 Pythonを用いた機械学習のモデル開発事例は多数ありますが、 そのモデルをビジネスやシステムに組み込み、運用する事例や方法論は多くありません。 そのため、AIを組み込んだ実装モデルをまとめた、 「機械学習システムのデザインパターン」に注目が集まっています。 【対象読者】 ・AIエンジニア ・システムエンジニア ・機械学習を本番システムとして使うための開発、運用方法で悩んでいるエンジニアの方 【本書の概要】 本書は機械学習を有効活用するためにはシステムに組み込むための設計や 実装が必要と考え、機械学...
ディープラーニング実践ガイド
ディープラーニングの基礎から応用(実践的な各種アプローチ)までを網羅! 本書では、ディープラーニングの研究で受賞歴のある3人の著者が、アイデアを現実世界の人々が使用できるものに変換するプロセスをステップバイステップで丁寧に解説します。構築するのは、クラウド、モバイル、ブラウザ、エッジデバイス向けの実用的なディープラーニングアプリケーションです。一部の章ではその章で扱うトピックの専門家をゲスト執筆者に迎えてさまざまな手法を解説しているので、読者のニーズにマッチするアプリケーションがきっと見つかるでしょう。対象読者は、ディープラーニングの世界にこれから参入したいソフトウェアエンジニアやベテラ...
機械学習デザインパターン
機械学習のベストプラクティスが学べるデザインパターン集! タイトルに「デザインパターン」とあるように、機械学習で繰り返し登場する課題を30のパターン(データ表現、問題表現、モデルの訓練、再現性、柔軟性、接続性、説明性、公平性などに関するもの)に分類し、それぞれについてベストプラクティスを提示・解説します。手を動かしながら機械学習を試したい初心者の実践的な入門書としても、現場のデータサイエンティストのリファレンスとしても読んでもらえる内容となっています。アメリカ海洋気象庁の研究者として、さらにGoogle Cloudのデータ分析&AI部門トップとしての豊富な経験に基づく実用本位の一冊です。
実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門
★基礎技術と分析アプローチがわかる入門書の決定版!★ ・「spaCy+GiNZA」による一気通貫の分析がすぐに実践できる ・観光/金融・経済/ソーシャルメディアの分析事例をていねいに解説 ・つまずきやすい「環境構築」もしっかりサポート 【本書はこんな人におすすめです】 ・Pythonの基本が身についたので、次はテキストアナリティクスを学んでみたい ・大学の講義やプログラミングスクールなどで自然言語処理について少し触れたが、もう少し詳しく学びたい ・テキストアナリティクスにつまずいたことがあったり、ブランクがあったりして再挑戦してみたい 【本書「巻頭言」より抜粋】 アイディア次第で...
実践 自然言語処理
さまざまな自然言語処理タスクを実装し実際のビジネスシーンへ適用する! 自然言語処理(Natural Language Processing:NLP)の本格的な実践書。過去10年間で起きたブレークスルーにより、NLPは小売、医療、金融、法律など、さまざまな分野での利用が増えてきました。急速に利用が拡大する中で、産業界でNLPを使ったシステムを構築するのに必要な知識を学べる講座や書籍は不足していました。本書を読むことで、NLPの要素技術やSNS、Eコマース、医療、金融といった具体的なビジネスへの適用方法に加えて、NLPシステムを開発するためのベストプラクティスを詳しく学べます。
IT Text 自然言語処理の基礎
深層学習をベースとした自然言語処理の基礎が体系的に身につく! 本書は、深層学習に基づく自然言語処理の基礎となる知識や考え方を、丁寧に展開し解説するものです。自然言語処理技術の概観から始め、機械学習の基本的枠組み、言語モデル・系列変換モデルとして非常に有用なTransformerとそれを活用した事前学習モデルの詳解、さらに自然言語処理の基本的なタスクである系列ラベリング、構文解析、意味解析と、自然言語処理を学ぶうえで必須の基礎知識や背景となる仕組みを幅広くカバーし、体系的に身につけることができる構成としました。 大学の学部上級から大学院の学生、さらには自然言語処理を学び始めた若手技術者にお...
大規模言語モデル入門
ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し、大きな話題となっています。大規模言語モデルは、大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降、自然言語処理や機械学習の知見をもとに、パラメータ数とテキストデータの拡大により、性能が飛躍的に向上しました。 Hugging Face社の"transformers"というPythonライブラリを利用することで、プログラミングの経験があれば、モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語...
大規模言語モデルは新たな知能か
対話型サービスChatGPTは驚きをもって迎えられ、IT企業間で類似サービスをめぐる激しい開発競争が起こりつつある。それらを支える大規模言語モデルとはどのような仕組みなのか。何が可能となり、どんな影響が考えられるのか。人の言語獲得の謎も解き明かすのか。新たな知能の正負両面をみつめ、今後の付き合い方を考える。 ■著者からのメッセージ 本書では大規模言語モデルの可能性と課題、その仕組みを一般の方に向けて書きました。また最新の研究成果にもとづいて現時点でわかっている知見や将来の展望もまとめています。 本書では大規模言語モデルのもつ大きな可能性とともに、考えられるリスクについても述...
自然言語処理〔三訂版〕
日本語や英語などの自然言語は人間の知的活動の根幹をささえるメディアである。自然言語のコンピュータ処理に関する研究・技術分野を自然言語処理と呼ぶ。近年のコンピュータおよびニューラルネットワークの進展とともに自然言語処理技術は劇的に進展し、ウェブサーチ、対話システム、機械翻訳などの応用システムが我々の日常に浸透しはじめている。本書では、自然言語の性質、コンピュータで処理するアルゴリズム、難しさ等を理解する。これによって、自然言語処理の応用システムを健全に利活用する能力を身につける。 1.自然言語処理の概要と歴史 2.文字列・テキスト処理の基礎 3.言語リソースの構築(1) 4.言語リソースの...
Pythonによる時系列分析
時系列データを上手く活用し、ビジネス成果を生み出す!! 時系列データを上手く調理することは、これらの問に何かしら解を与えることができます。特に予測モデルを上手く活用すると、過去を振り返り、未来を予測し、現在すべきことを導きだし、成果へと繋げることができます。いくら高精度な予測モデルを手にしても、どう活用すべきかわからないと成果は生まれません。そこで本書ではどのように扱うかを、実際のデータを用いて、使い方を重点的に解説していきます。時系列分析の多くの書籍は数式等を用いて解説していますが、実務的な運用には理論よりもPython等コードで実践していくことが重要です。 第1章 ビジネスにおける時...
時系列解析
「時系列解析」は過去の自身のデータから未来のデータを予測するために用いられる手法であるが,予測だけでなく,事象の分解・理解に強みを持つ手法でもある。本書では,応用範囲の広い「時系列解析」について,マーケティングやIoTなどの現場における実解析で応用ができるように解説の内容を選定し,手法の基礎的な理論をPythonのサンプルコードとともに解説した。簡単なデータを用いた簡単な課題を例にとり,基礎的なモデル構築の過程を段階的に体験できるように,また,自学により応用範囲を広げてもらえるように,どの場面で,なぜその手法を使うのかを考えられるように説明している。 本書では,経済・マーケティングの分...
実践 時系列解析
統計的手法と機械学習手法の両方を使用した汎用性の高い時系列分析手法! 本書は「時系列データ」の切り口から書かれたデータ分析の入門書です。時系列データが使われる範囲は広く、医療データ、金融分析、経済予測、天気予報など、さまざまな分野で使われています。本書は時系列データを通してデータ分析手法を学んでいくアプローチで、データのクリーニング、プロットの方法、入出力など基本的なトピックについてひととおりカバーしてから、さまざまな分野のさまざまな事例を取り上げ、統計的手法と機械学習手法の両方を時系列データに適用し、また人気のオープンソースツールも積極的に取り入れた手法を紹介します。
経済・ファイナンスデータの 計量時系列分析
基礎的な考え方を丁寧に説明すると共に,時系列モデルを実際のデータに応用する際に必要な知識を紹介。〔内容〕基礎概念/ARMA過程/予測/VARモデル/単位根過程/見せかけの回帰と共和分/GARCHモデル/状態変化を伴うモデル 1. 時系列分析の基礎概念 1.1 時系列分析の基礎 1.2 定常性 1.3 ホワイトノイズ 1.4 自己相関の検定 2. ARMA過程 2.1 ARMA過程の性質 2.2 ARMA過程の定常性と反転可能性 2.3 ARMAモデルの推定 2.4 ARMAモデルの選択 3. 予測 3.1 予測の基礎 3.2 AR過程の予測 3.3 区間予測 3.4 MA過程の予測...
点過程の時系列解析
本書は点過程の時系列解析についての入門書である。 点過程の時系列とは,データがある着目するイベントの発生時刻の集合として特徴付けられるようなタイプの時系列である。実世界の様々な現象が点過程として表現することができ,例えば自然現象としては,地震,神経細胞のスパイク発火,遺伝子発現などが考えられる。さらに近年,人間の社会行動に関する様々な大規模データが蓄積され,それが利用可能になってきたことを背景として,金融取引,保険事故,人々のコミュニケーション,SNS上でのユーザーの活動等のデータを解析するために,点過程が用いられることが増えており,点過程の応用範囲は急速に拡大している。 本書では,...
PyTorch実践入門
ディープラーニングの重要な基礎概念と、PyTorchを用いたディープラーニングの実装方法について、細部まで掘り下げて解説。限られたデータでニューラルネットワークを訓練する方法、訓練済みモデルのデプロイ方法など『ディープラーニング・プロジェクトのベストプラクティス』を提示します。 ・ディープラーニングのメカニズムを解説 ・Jupyter Notebook上でサンプルコードを実行 ・PyTorchを用いたモデル訓練の実施 ・実データを使用するプロジェクトをベースに実践的解説 ・本番環境へのさまざまなモデルデプロイ方法 PyTorchで実際にどのように組み込まれて実現されているのか、細部...
Pythonで学ぶ音声認識 機械学習実践シリーズ
「音声認識」とは音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるまでを目的とし、手法の目的やアルゴリズムの概要を解説、続いて数式レベルでの詳説、最後にソースコード付きで実装という流れで解説しています。特に手法の概要については「その手法は何を目的として生み出されたのか」という経緯と「なぜその手法は前述の目的を達成できるのか」について直感的に理解できるよう工夫しています。
Python対応 ディジタル信号処理
豊富な例題や図例を取り入れた,わかりやすいテキストです.ディジタルフィルタリングおよび離散フーリエ変換を中心として,ディジタル信号処理の基礎理論が習得できます.Pythonによる各種のプログラミング例を多数収録しており,実際に動かして確認することで,より理解を深めることができます. 第1章 序論 第2章 離散時間信号 第3章 離散フーリエ変換 第4章 高速フーリエ変換 第5章 ディジタルフィルタの基礎 第6章 z変換 第7章 ディジタルフィルタの解析 第8章 周波数選択性ディジタルフィルタ 第9章 FIRフィルタの設計 第10章 IIRフィルタの間接設計 第11章 IIRフィルタの直接設...
Pythonによる地理空間データ分析
例題を試しながら地理空間データ分析の基本を学べる! 数字だけの分析ではなく、地理空間を組み合わせることで、より立体的で精度の高い予測、分析ができるため、注目を集める地理空間データ分析をPythonで行うための入門書です。 既存の公開データ、Jupyter Notebookで提供されているサンプルコード、QGISというオープンソースのGISソフトを使い、手軽に試して結果を出力してみることができます。空間データ分析において重要ながらも見過ごされがちな、正確なマップをデザインするコツ、非定型データ型の処理のテクニックなどもフォローしています。
空間統計学
空間統計学の“Lower the bar”を目的として、その理論と具体的なモデリング技法を網羅的かつ丁寧に解説。地球統計学と空間計量経済学、自然科学、人文・社会科学という異なる両分野のモデリング技法を、同一書籍の中で統一的に解説する初の試み。
実践Data Scienceシリーズ Rではじめる地理空間データの統計解析入門
★「いつか学ぼう」と思っていたなら、今!★ 初歩から実装まで悩まず進める! GISの基本から始まり、今ホットな時空間データの解析まで解説。 サンプルコードと出力結果が詳細だから実践しながら学べる、最高のガイド! [主な内容] 第1部〈導入編〉 空間データの統計解析の基礎 第1章 はじめよう! 地理空間データの統計解析 第2章 統計学の基本 第3章 回帰モデルの基本 第4章 Rの基本 第5章 Rによる空間データ処理・可視化の基本 第2部〈基礎編〉 地域データの記述統計 第6章 空間相関と近接行列 第7章 大域空間統計量 第8章 局所空間統計量 第3部〈基礎編〉 地域...
現場のプロがわかりやすく教える位置情報エンジニア養成講座
ウェブで位置情報を扱う際は、大規模なデータを利用するため、クライアントサイドとサーバーサイドの両面で多くの工夫・発明が日々なされており、そのことが初学者にとって理解を難しくしています。しかし、これらを体系的に整理した資料や書籍が少ないというのが現実です。そこで本書では、最短距離で「位置情報アプリケーションを開発できるようになる」「要件に応じたベストプラクティスを学べる」「最新のトレンドを把握できる」ように構成しており、この一冊で位置情報エンジニアとしての知識がすべて身に付きます。 まずは位置情報を使ったサービス・アプリ開発に必須となる知識や概念を説明し、次にアプリケーション開発に必要とな...
マーケティングデータ分析
実際のデータを用いながらマーケティングデータ分析の基礎を学ぶ。データとサンプルコードはダウンロード可能。〔内容〕マーケティングにおけるデータ分析/マーケティング分析のためのデータ/集計と可視化からのデータ理解/他
需要予測の戦略的活用
日本ではまだなじみの薄い「オペレーションズ・マネジメント」(Operations Management)の各種概念を、アカデミックとビジネスの両目線で体系的に整理したオペレーションズ・マネジメント選書シリーズの1冊。物と情報の流れを管理するSCM(サプライチェーンマネジメント)のトリガー、何が、いつ、どこで、何個売れるのかといった需要予測をメインテーマとして扱っている。 海外の論文や書籍を参照しアカデミックな理論による演繹的な考察とビジネス事例からの帰納的な考察を行き来し、ヒューリスティクスなど需要予測と離れた領域の知を掛け合わせたアイデアの創出を試みた書。 需要予測に携わる実務家と...
A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは
経営層やリーダー、データサイエンティスト、エンジニア、アナリスト、プロダクトマネージャーなど、企業の全関係者を対象として、その概念から実験を実施するためのプロセス、よくある落とし穴、オンライン実験をスケールさせるために必要なことまで、A/Bテスト、コントロール実験の詳細を解説する。 Google, Amazon, Microsoft, LinkedInなどで実際に実践された経験から得られた教訓や落とし穴などがふんだんに盛り込まれており、データ駆動型の文化の確立、科学的な意思決定に必要なスキルを獲得できる。 第I部 すべての人向けの導入的トピック 第1章 導入と動機付け 第2章 実験の実行...
推薦システム実践入門
推薦システムの導入を仕事に活かす! レコメンド機能はAmazonやYouTubeなど多くのウェブサービスに組み込まれ、新たに推薦システム(レコメンド機能)の導入が検討されることも増えています。本書は、「実際のビジネスに活かす」ことを目的に、著者たちが経験してきた事例を用いて、ビジネス的な仮説や問題設定の仕方、プロジェクトの進め方をわかりやすく解説します。推薦システムの概要を把握し、適切な推薦システムの実装ができるようになります。
「原因と結果」の経済学
「健診を受けていれば健康になれる」「テレビを見せると子どもの学力が下がる」「偏差値の高い大学に行けば収入は上がる」はなぜ間違いなのか? 世界中の経済学者がこぞって用いる最新手法「因果推論」を数式なしで徹底的にわかりやすく解説。世のなかにあふれる「根拠のない通説」にだまされなくなる!
政策評価のための因果関係の見つけ方
経済学におけるランダム化比較試験のパイオニアである エステル・デュフロ教授らによる、理論的解説と実践的ノウハウが凝縮。 監訳者の小林庸平氏による解説は、 本書の難解な部分を直感的でわかりやすい解説で補いながら、 近年注目されている「エビデンスに基づく政策形成(EBPM)」に ランダム化比較試験をどう活かしていくかを展望。 EBPMに関心のある人、経済学の実証研究に関心のある人、必見! 近年、注目を集める因果推論。その代表的手法であるランダム化比較試験(RCT)について理論的に解説するのみならず、現実社会のフィールドでRCTを行う場合に、どういったことに気を付ければよいのか、理想的な...
因果推論の科学 「なぜ?」の問いにどう答えるか
「人工知能の巨人」が放つ「なぜ?の科学」の革命的な入門書! 「私自身、この本の解説を書くことが憚られるくらいの凄い内容」 --松尾豊氏(人工知能学者・東大大学院教授)絶賛! 米Amazonでは1256レビュー、4.5★。ポピュラーサイエンスの世界的ベストセラー! ・今までの統計学では答えられなかった「なぜ?の科学」とは? ・それは3段の「因果のはしご」を使って説明できる ・著者は人工知能界のノーベル賞にあたるチューリング賞受賞! ・現在のデータ主義には限界がある。それを乗り越える「因果推論」とは? ・その商品が売れた理由をどう分析し、新たな儲けにつなげるか? ・公衆衛生...
つくりながら学ぶ! Pythonによる因果分析
ビジネス現場ではデータ活用の重要性がますます高まっています。データに基づいた経営施策の実施とその効果検証のためには、一般的な統計指標(平均、標準偏差、相関)だけでなく「因果」にまで分析を広げる必要があります。 本書は因果分析の重要な2つの領域である「因果推論」および「因果探索」について、実際にプログラムを実装しながら学ぶ書籍です。因果推論や因果探索を学びたいビジネスパーソンや、初学者の方を対象としています。 ・因果推論とは「テレビCM放映で、商品購入量がどれくらい増えたのか?」「研修の実施で、社員スキルがどの程度向上したのか?」など、なんらかの施策を実施した際に、その施策の効果を推...
因果推論入門〜ミックステープ:基礎から現代的アプローチまで
因果推論とは、ある要因が何を(どれくらい)引き起こしたのかを判断するためのツールです。本書は、因果推論に関する最近までの進展をまとめ、学生や実務家を対象として、因果関係に関する意味のある回答を導き出すために必要な統計的手法を解説していきます。 本書の最大の特徴は、理論だけでなく、統計プログラミング言語(R、Stata)による実装を重視している点にあります。例題には、読者が利用できるデータとコードが添付されており、すぐに手を動かして実践することができます。本書は機械学習に関するトピックを含まない一方で、理論的な解説が詳細であるほか、DAGや合成コントロール法といった発展的なトピックを扱っ...
インベンス・ルービン 統計的因果推論(上)
統計的因果推論の基本文献 "Causal Inference for Satistics, Social, and Biomedical Sciences: An Introduction" 待望の全訳! ノーベル賞経済学者インベンスと,Rubin流アプローチを拓いたルービンの協同作業から生まれた入門書にして基本書. 具体的な小事例に沿って潜在的結果変数(potential outcomes)に基づく分析モデルのコンセプトを平易に解説."An Introduction"の名のとおり数理的な難渋さに陥ることなく,統計学,社会科学,医学生物学,データサイエンスなど幅広い読者に推奨できる内容....
インベンス・ルービン 統計的因果推論(下)
統計的因果推論の基本文献 "Causal Inference for Satistics, Social, and Biomedical Sciences: An Introduction" 待望の全訳! ノーベル賞経済学者インベンスと,Rubin流アプローチを拓いたルービンの協同作業から生まれた入門書にして基本書. 具体的な小事例に沿って潜在的結果変数(potential outcomes)に基づく分析モデルのコンセプトを平易に解説."An Introduction"の名のとおり数理的な難渋さに陥ることなく,統計学,社会科学,医学生物学,データサイエンスなど幅広い読者に推奨できる内容....
Pythonではじめる異常検知入門 -基礎から実践までー
ビジネスの現場で異常が発生することは、従来通りに順調に進めてきた業務が妨げられ、原因究明や修理に時間と手間をとられることになるため、異常が発生する前に、もしくは発生したとしても、早めに検知して対策を取りたいものです。 本書を手に取られた読者の方々が、各自のデータで分析を行い、異常を検知するためのスタートの手助けになる書籍を書けないかと思ったことが、本書を執筆するに至った理由です。そのため、第I 部と第II 部は、知識と方法に関しての説明を行っていますが、第III 部の実践では、分析例をお示ししており、そこで用いたソースコードとcsv 形式にしたデータをダウンロード可能な環境として整備しま...
異常検知と変化検知
企業所属の著者が、データ解析に携わる人の視点でまとめた。必要な理論を幅広く、体系的に述べる。大規模データから「珍しいパターン」を見出す、あるいは変化の「兆し」を素早くつかむ必要がある人なら必読。するする読めて、ずっと使える1冊。現在知られている異常検知・変化検知の手法の大半をカバーした。 企業所属の著者が、データ解析に携わる人の視点でまとめた。必要な理論を幅広く、体系的に述べる。大規模データから「珍しいパターン」を見出す、あるいは変化の「兆し」を素早くつかむ必要がある人なら必読。 【機械学習プロフェッショナルシリーズ】 本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用...
ネットワーク分析 第2版
ネットワーク分析とは,さまざまな対象を点と線からなるネットワークとして表現し,その構造的な特徴を探る研究方法である。本書は,データ分析用のフリーソフトであるRを使って,ネットワーク分析の理論と実際の分析法を学ぶことを目的としている。 第2版では,近年応用の進んでいる統計的なネットワークの分析手法に関する説明を加えた。また,社会ネットワークの調査分析法およびソーシャル・メディアのネットワーク分析に関する章を新たに設けた。複雑ネットワークおよびネットワーク描画に関する章も大幅に改訂している。これらの改訂により,ネットワーク分析の応用的なニーズにも対応できるようになった。
ネットワーク科学
インターネットから,社会ネットワーク,われわれの生物的な在り方を決める遺伝ネットワークまで,ネットワークはあらゆるところに存在する。本書は,ネットワーク科学の第一人者アルバート・ラズロ・バラバシ教授(ノースイースタン大学)による,今後,古典となりうるネットワーク科学の教科書である。物理学,コンピュータサイエンス,工学,経済学,社会科学などの非常に広い範囲にわたる現実のネットワークを取り扱った学部生と大学院生向けの教科書であり,大変魅力的なフルカラーの書籍にまとめられている。また,多くの数式を用いた説明や豊富なオンライン資料などは,さまざまな分野の研究者がネットワーク科学を自分の研究に活用...
Pythonで学ぶネットワーク分析
さまざまな関係性の構造をPythonで分析する! ネットワーク分析は、あらゆる「関係性」を分析する学問です。 構造をモデル化することで、ネットワークという言葉から想像しやすいWebやSNSの分析だけでなく、たとえば感染症の伝搬経路を見つけたり、未来の人間関係を予測したりすることが可能です。マーケティングなどの現場でも使用されています。 本書では、ネットワーク構造をもつデータをPythonで分析するための基礎知識を習得できます。 分析には、Google Colaboratory(クラウド上で使用できるJupyter Notebook環境。Colabとも呼ばれる)を用います。ブラウザ上で動...
スパース推定法による統計モデリング
変数選択問題は統計学における重要な問題の一つである。この問題に対して,近年,変数選択とモデルの推定を同時に行うスパース正則化を用いる方法が開発された。この方法によって,従来では扱うことが難しかった高次元データに対しても変数選択が実行可能となり,スパース正則化法は一気に注目されるようになった。さらに,変数選択だけでなく,データ発生の疎性構造を抽出するという,より一般的な観点からの研究が進むようになり,たとえば,グラフ構造における辺選択などにも拡張されている。これらの方法は総称してスパース推定と呼ばれ,統計学の基本ツールになりつつある。 本書は,スパース推定の入門的内容から発展的内容までを...
スパース推定100問 with Python
スパース推定は,サンプルに対して変数の方が圧倒的に多い場合の統計学である。たとえば,症例対照100名のサンプルがあって,1万の遺伝子の蛋白質生成量からどの遺伝子がその病気の原因になっているのかなどの問題解決に役立つ。また,機械学習の諸問題にも適用されている。 スパース推定に関して,数学的に検討してアルゴリズムを導くことや,パッケージにデータを入れて動作を観察することは他書でもやっている。本書の特徴は,理論から実際にシンプルなプログラムを構築して動作を確認するなど,思考を止めないで,全体を検証している点にある。そうすることで,見えない本質が見えてくるばかりか,理論的に考えたことが正当化さ...
スパースモデリング 理論、アルゴリズム、応用
スパースモデリングは、現代統計学、機械学習、信号処理の分野で活用されています。測定費用やその他の制限によって、比較的少ない数しか得られていない測定値から、観測されていない高次元の信号を正確に復元する手法です。画像復元、データからのモデル・パラメータ学習、システム障害や人間の病気の診断は、取り組みが期待される例です。 『Sparse Modeling: Theory, Algorithms, and Applications』(Irina Rish, Genady Grabarnik 著)を翻訳した本書は、さまざまな問題をスパースモデリングへ簡潔に導入する試みを行っています。スパース復元...
機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで
「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。 ・Pythonプログラミングとともに、ゼロからていねいに解説。 ・コードが公開されているから、すぐ実践できる。 ・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。 【おもな内容】 Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): ...
強化学習(第2版)
不朽の名著、待望の改訂版! 強化学習発展の立役者自らが書き下ろした書。「強化学習の考え方とアルゴリズムを明確に簡潔に説明する」という第1版の特長はそのままに、第2版では、発展的手法や心理学・神経科学との関係の紹介が大幅に加筆されています。 第I部では、テーブル形式の範囲でできるだけ多くの強化学習を扱い、核となる考え方を単純な設定で進めます。第II部では、そうした考え方を関数近似に拡張します。第III部では、心理学・神経科学との関係、AlphaGoなどのケーススタディ、将来展望について述べています。 ますます重要性を増す強化学習について、基礎から応用までを学べる一冊です。 [原著]Re...
Pythonで動かして学ぶ!あたらしいベイズ統計の教科書
機械学習エンジニア必見! ベイズ統計の基礎から ベイズ統計モデリングまで Pythonプログラムをもとに丁寧に解説! 【本書の内容】 ベイズ統計の基礎知識からベイズ統計モデリングまで、 Pythonのプログラムをもとにわかりやすく解説した書籍です。 前半ではベイズ統計の理解に必要な確率の説明からはじまり、 ベイズ統計学、ベイズの定理、ベイズ推定の基本事項をわかりやすく解説。 後半では線形モデルを例題として、MCMC法を用いたモデルの推定方法について解説します。 【本書で扱うベイズの定理について】 事後分布を求める際に問題となる、ベイズの定理の積分計算を回避する方法を2つ紹介します...
Pythonではじめるベイズ機械学習入門
★確率的プログラミング言語がすぐに使える!★ ・Pythonでのコーディングを前提に、PyMC3、Pyro、NumPyro、TFP、GPyTorchをカバー。 ・回帰モデルの基本から潜在変数モデル・深層学習モデルまでを幅広く解説。 【主な内容】 第1章 ベイジアンモデリングとは 1.1 データ解析とコンピュータ 1.2 ベイジアンモデリングの基礎 1.3 代表的な確率分布 1.4 近似推論手法 第2章 確率的プログラミング言語(PPL) 2.1 ベイジアンモデリングとPPL 2.2 自動微分・最適化アルゴリズム 2.3 PyMC3の概要 2.4 Pyroの概要 2.5 NumPyro...
実証分析入門
政策効果の評価などで注目を集める「因果関係」の推測方法を、数式に頼ることなく解説。実証分析の「作法」が身につく。 第1章 実証分析における心構え: これからの「実証」の話をしよう 第2章 実証分析の落とし穴: こんなの絶対おかしいよ 第3章 確率統計の基礎: 高校時代に逢った、ような…… 第4章 OLS: わたしの、最高の友達 第5章 重回帰分析: 魔女の作り方 第6章 決定係数R2: ☆もりはつ☆の59%は勢いで出来ています 第7章 仮説検定(1): お前はもう死んでいる 第8章 仮説検定(2): 私が死んでも代わりはいるもの 第9章 さまざまなモデル...
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析
★ 実験を効率化する強い味方 ★ もう実験で疲弊しない。次に試す実験条件は、データと統計学が教えてくれる! ベイズ最適化とPythonを駆使して、効率よく研究・開発を進めよう! 《すぐに試せるサンプルデータセット・サンプルコード付き》 ■ データ解析の初歩から、モデルの設計、実践的な応用事例までを導く。 ■ 実験時間や人数が限られる今、絶対に役立つスキルが身につく! ■ 入門書であり、実践書。フルカラー! 【目次】 第1章 データ解析や機械学習を活用した分子設計・材料設計・プロセス設計・プロセス管理 ・ケモ・マテリアルズ・プロセスインフォマティクス ・分子設計 ・材料設計 ・なぜベ...
最適化手法入門
「最適化」を使うことを目指して、さまざまな最適化モデルを解説した。理論は必要最低限にとどめ、具体的な例とPythonコードを多く掲載している。東京大学のUTokyoOCWの講義映像「数理手法3」とも連携! 【データサイエンス入門シリーズ】 第1期として、以下の3点を同時刊行! ・データサイエンスのための数学:椎名 洋・姫野哲人・保科架風(著)清水昌平(編) ・データサイエンスの基礎:浜田悦生(著)狩野 裕(編) ・最適化手法入門:寒野善博(著)駒木文保(編) 第2期の刊行は2019年11月の予定(^o^)/ 【「巻頭言」より抜粋】 データサイエンス分野の遅れを取り戻すべく、日本で...
Python意思決定の数理入門
さまざまな意思決定の数理や現象をPythonで体験して学ぼう! 本書は、数理的に扱える意思決定の基礎を、Pythonを用いたシミュレーションや分析によって実際に試しながら学ぶものです。 アンカリング効果の評価法、ベイズ推定に基づいた信憑性の変化、エージェントや強化学習を適用した意思決定、不完備情報ゲーム、集団の意思決定などを解説しています。 本書では、意思決定のモデルの立て方、意思の測定分析などの説明に重点を置き、計算やシミュレーションの詳細な説明よりはPythonによる実行に基づいて学ぶ体験学習のかたちをとります。また、すべてのプログラムはJupyter Notebook形式で配布し、...
これなら分かる最適化数学
最適化手法とは,利益,損失などの望ましい,あるいは望ましくない値を最大,または最小にするように設計する手法である。従来から経営学やオペレーションズリサーチ(OR)の中心テーマであったが,計算機技術の進歩によって過去には不可能と思われた複雑な問題が実際的な時間で解けるようになり,今日ではあらゆる工学分野,特に電子,情報,通信技術の設計のほとんどに浸透している。 本書はこの立場から,最適化手法の入門書として書かれたもので,経営学やORのみならず,統計的最適化や機械学習に関する話題も扱っている。また,各手法を紹介するだけでなく,その数学的背景の解説に力点を置いている。 本文中では最適化手法...
プログラミングのための線形代数
本書は、専門・非専門を問わずコンピュータにかかわる方を主な対象に想定した線形代数の参考書です。単に「線形代数プログラムの書き方」を解説する本ではなく、数学のプロでない読者に線形代数の本音を語ることが狙いです。
スタンフォード ベクトル・行列からはじめる最適化数学
《これが世界標準! 世界もここから始めてる!!》 データサイエンス・機械学習を学ぶ「はじめの一歩」として、スタンフォード大学にて使用されている教科書“Introduction to Applied Linear Algebra: Vectors, Matrices, and Least Squares”がついに翻訳!! ・豊富な事例を示しながら、ベクトル・行列の基本から最小二乗法による機械学習までをていねいに解説! ・データサイエンス・機械学習に必要な数学の学び直しにうってつけ! ・章末問題が298問掲載されているから、完全に理解できる! ・Julia言語によるプログラミング課題が原著...
Python 実践AIモデル構築 100本ノック
本書は、Pythonの実践的な力を身に付けるというコンセプトで好評を博した『Python100本シリーズ』シリーズの一冊として、実際のビジネス現場でも応用可能な、AIモデル構築の一連の流れを学べるように設計した問題集です。数学的な説明は極力控え、前処理からパラメータチューニング、AIアルゴリズムの特徴や長所短所まで学べます。
Pythonで学ぶアルゴリズムとデータ構造
現代社会を支える根幹技術をPythonで! Pythonプログラミングのスキルアップにも最適! 名著『Pythonスタートブック』の著者である辻真吾氏が書き下ろす至極の入門書! ソートやグラフ構造など基本的な内容から、乱択アルゴリズムや数論、ブロックチェーンの仕組みなどの幅広い話題までを解説。コードはWeb公開( https://github.com/tsjshg/pyalgdata)。 【データサイエンス入門シリーズ】 第2期として、以下の2点を同時刊行! 『統計モデルと推測』松井秀俊・小泉和之(著)竹村彰通(編) 『Pythonで学ぶアルゴリズムとデータ構造』辻真吾(著)下平...
日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック
統計検定準1級試験対応の公式テキスト。 出題範囲となっているさまざまな統計学及び機械学習のトピックについて、実践的な例題を解きながら学ぶことができる。 頻出項目に重点をおき、項目ごとに解説と例題を示した。 統計検定準1級で出題されるトピックは非常に広範にわたるため、さまざまな統計的手法の辞典としても役立つ。 【 目 次 】 1 事象と確率 2 確率分布と母関数 3 分布の特性値 4 変数変換 5 離散型分布 6 連続型分布と標本分布 7 極限定理,漸近理論 8 統計的推定の基礎 9 区間推定 10 検定の基礎と検定法の導出 11 正規分布に関する検定 12 一般の分布に関する検定法 1...
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
シリーズの第2弾は、初学者向けのKaggle入門書の決定版! ★「Kaggleで勝つ」準備をしよう!★ 初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれるような内容を目指しました。 ・サンプルコードの詳細な解説があるから、しっかり身につく! ・優勝チームと専業Kagglerのコンビによる、安定のわかりやすさ! ・充実の本音対談で、やさしくサポート! ・初学者や手探りでやっているが体系的な知識を得たい人に最適。 【本書のサポートページ】 https://github.com/upura/python-kaggle-start-book 【実践...
Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ
本書は世界各国で出版・公開された書籍 "Approaching (Almost) Any Machine Learning Problem" の翻訳書です。豊富なコード例と機械学習にまつわる基礎的な内容を取り上げていきます。 交差検証や特徴量エンジニアリングなどモデル作成以前の重要な要素にも紙面が割かれ、コードの再現性やモデルのデプロイといった話題にも踏み込みます。 モデル作成では、表形式のデータセットだけでなく、画像認識や自然言語処理に関する内容が具体的な実装と共に示されます。 本書の節々から、性能を追求するだけではなく実運用にも重きを置いた著者の姿勢が垣間見えるでしょう。 "Ka...
Kaggleに挑む深層学習プログラミングの極意
★最強最短の近道は、これだ!★ ・画像・自然言語処理の機械学習コンテストに取り組みながら、深層学習の具体的な知識をいち早く身につけよう! ・レジェンドたちの豊富な経験に基づくスキルアップのノウハウも満載! 【主な内容】 第1章 機械学習コンテストの基礎知識 1.1 機械学習コンテストのおおまかな流れ 1.2 機械学習コンテストの歴史 1.3 機械学習コンテストの例 1.4 計算資源 第2章 探索的データ分析とモデルの作成・検証・性能向上 2.1 探索的データ分析 2.2 モデルの作成 2.3 モデルの検証 2.4 性能の向上 第3章 画像分類入門 3.1 畳み込みニューラルネット...
The Kaggle Book:データ分析競技 実践ガイド&精鋭31人インタビュー
データサイエンスコンペティション(競技)プラットフォームKaggleでは、世界中の何百万人もの人々が参加。データ分析スキルを向上させ、素晴らしいコミュニティを作り、キャリアアップに役立つ貴重な経験を得ようとしています。本書では、Kaggle Grandmasterの著者2人がモデリングや検証戦略などこれまでに蓄積されたテクニックを解説。Kaggle特有のヒントだけでなく、より一般的なテクニックも学べます。Kaggleのランクを上げたい、データサイエンスのスキルアップを図りたい、既存のモデルの精度を上げたい、といった方への格好の一冊です。
職業訓練校のグループワークで作成した模擬ECSiteの紹介
はじめに 僕は、'23/1~'23/7の半年間、WEBアプリ技術者育成科の職業訓練校に通っていました。 その際にグループワークとして、五名一組でグループを組み、企画、設計、開発、テスト、発表と一通り開発経験を積みました。 その際に作った提出物の担当した機能の紹介をしていこうと思います。 本題
リーダブルコード
コードは理解しやすくなければならない。本書はこの原則を日々のコーディングの様々な場面に当てはめる方法を紹介する。名前の付け方、コメントの書き方など表面上の改善について。コードを動かすための制御フロー、論理式、変数などループとロジックについて。またコードを再構成するための方法。さらにテストの書き方などについて、楽しいイラストと共に説明する。日本語版ではRubyやgroongaのコミッタとしても著名な須藤功平氏による解説を収録。
過酷なデスクワークからわいの身体を守るアイテムたち
締め切り直前に👇に投稿してみるやつ はじめに 毎日毎日椅子に座り机に向かって仕事をしていれば身体にダメージが蓄積されていくでしょう。私も毎年のようにぎっくり腰になるようになってしまいました。リモートワークにより仕事の環境も変わってきました。自宅で仕事をするに当たり新たに気をかけなければならないことも生まれてきたでしょう。そんな中で私が実際に身体を守るために使用しているアイテムを紹介する、そんな記事…