yomitech
← バックナンバー一覧

今週のQiita技術書まとめ

2020年11月22日配信

インフラエンジニアでもできる!データ基盤の構築に役立つコンテンツ6選

Global Mobility Service Advent Calendar 2020( データ基盤(もしくはデータ分析基盤)と呼ばれるシステムの構築を行なっています。 データ基盤とは、組織内のあらゆるデータを活用し、意思決定を可能にするためのデータを集めるシステムのことです。 筆者はいわゆるインフラエンジニアの業務を主に行っています。例えば、コンテナを使ったアプリケーションインフラの構築などで…

AWSではじめるデータレイクの表紙

AWSではじめるデータレイク

上原 誠/志村 誠/下佐粉 昭/関山 宜孝 ・テッキーメディア

「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。 本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。 従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されま...

「問題解決のためのデータ分析」を読んで参考になった部分を抜粋

はじめに 本記事は、「問題解決のためのデータ分析( 誰にとっても学びがあるような汎用的なものではないことを予めお伝えしておきます。 免責 ですます調の不統一等、文章として適当な部分が多いのですが、私の読書メモとして多めに見てやってもらえると助かります。

問題解決のためのデータ分析新装版の表紙

問題解決のためのデータ分析新装版

齋藤健太 ・クロスメディア・パブリッシング

新入社員からマネジャーに至るまで、ビジネスに絶対必要な問題解決と、業績を伸ばす実践的なデータ分析を徹底解説。問題解決力・仮説の構築・データ集め・分析、売上アップから新商品の開発まで、知識ゼロからデータ分析がサクッとわかる!

【合格】Googleの認定資格 PCA(Professional Cloud Architect)を取得した話

PONOS Advent Calendar 2020( 1日目の記事です。 はじめに:eyeglasses: Googleの認定資格 Professional Cloud Architect を取得しました。 学習方法、スケジュール、試験会場、本番試験の感想などを紹介します。 この記事の対象者:eyeglasses:

GCPの教科書の表紙

GCPの教科書

クラウドエース株式会社 吉積 礼敏・他 ・リックテレコム

<B>Google Cloud Platform(GCP)マニアのクラウドエースが解説するクラウドエンジニア必携「GCPの教科書」!</B> Google Cloud Platform、略称「GCP」はグーグルが提供するプラットフォームで、その中では、今注目の「機械学習」「ビッグデータ」関連のサービスが特に充実しており、AI関連のシステム基盤として要注目の環境となっています。 <B>【対象読者】</B> 本書は、自他共に認めるGoogle CloudPlatform(以下、GCP)マニアであるクラウドエースが、GCP をぜひ皆さんに使っていただきたいと考えて執筆したものです。 「GCP...

~日々成長し続けるために~マジでやってよかった4つのプラクティス

0. はじめに 人生100年時代。勉強し成長を続けていくことは欠かせないかと思います。 日々勉強を続けるためには、モチベーションが重要なキーとなってきます:fire: しかし、人間なので「なんか怠い...」「今日はいっかー...」「時間ねぇし...」と、自分に言い訳してしまう状況は多々あります。 中には呼吸するように勉強・プログラミングする人もいますが、残念ながら私はそっちタイプではないので・・・…

学びを結果に変えるアウトプット大全の表紙

学びを結果に変えるアウトプット大全

樺沢 紫苑 ・サンクチュアリ出版

「激動の10年で最も支えになった本」1位!! 読者が選ぶビジネス書グランプリ2025<特別賞>「10年を彩るビジネス書」 に選ばれました! シリーズ100万部突破! 説明・アイデア・雑談・交渉など…… すべての能力が最大化する。 日本一情報を発信する精神科医が贈る、 脳科学に裏付けられた、伝え方、書き方、動き方 「メルマガ、毎日発行13年」「Facebook、毎日更新8年」 「YouTube、毎日更新5年」「毎日3時間以上の執筆11年」 「年2〜3冊の出版、10年連続」「新作セミナー、毎月2回以上9年連続」 ……日本一アウトプットしている医師である、ベストセラー作家・樺沢紫苑...

【保存版】データサイエンティスト転職を決めるポートフォリオのガイドライン【書籍化決定】

書籍化されました :tada: - 本記事をベースに監修者の村上さんが1冊の本にまとめてくれました(感謝) - データサイエンティストのキャリア面やポートフォリオの細かい部分をさらに追加・ブラッシュアップした内容になっています。 まえがき はじめに

データビジュアライゼーションの教科書の表紙

データビジュアライゼーションの教科書

藤 俊久仁/渡部 良一 ・秀和システム

データ分析の結果を正しく表現し、適切に伝えられていますか? 本書は、データを効果的に表現するコミュニケーションの技術を、 ・考え方(理論編)とテクニック(実践編)に分け、 ・実践編では、悪い例と改良例の比較形式で示した72通りの実例を用いて、 わかりやすく伝授します。第7章では、人気のBIツールTableau(タブロー)を用いて、実践的に解説しています。

第11回 Cisco DevNet Associate (DEVASC 200-901) 受験記録

第一回の受験結果 合格点1000/825のうち760で不合格 試験範囲と各セグメントの結果 • ソフトウェアの開発と設計 /取得率50% • Cisco API(Application Programming Interfaces)の知識と使用 /取得率70%

データサイエンス関連の本を紹介する。

大学3年生の時に統計学の勉強をし始めて、今年で4年目を迎えています。 色々な書籍紹介の記事を読んだりしますが、どれくらいのレベルの時に、どれくらいの本を読んで、どんな感じになったのかという紹介は意外と少ないなと感じています。 今回はせっかくなので、自分がどういう勉強をしてきたかを振り返りながら、書籍紹介ができたら誰かの役に立つかなと思ってこの記事を書いてみました。 本の画像はAmazonへのリンク…

scikit-learn、Keras、TensorFlowによる実践機械学習

Géron,Aurélien 下田,倫大,1985- 長尾,高弘,1960- ・オーム社

弱点克服大学生の確率・統計の表紙

弱点克服大学生の確率・統計

藤田岳彦 ・東京図書

大学での定期試験対策から、金融数理やアクチュアリー試験の数学の準備まで。

自然科学の統計学の表紙
統計学入門の表紙

統計学入門

東京大学 ・東京大学出版会

カーネル多変量解析の表紙

カーネル多変量解析

赤穂昭太郎 ・岩波書店

複雑な非線形データが与えられたとき、非線形モデルを工夫してそれにあてはめて解析するのではなく、線形モデルを用いて非線形データの解析を行なうというのが「カーネル法」のねらいである。一般には、高次元の束縛を受けるが、それを回避するのが正則化という発想だ。カーネル法は文字列やグラフの解析など、適用範囲も広い。本書はその基本から応用までをていねいに解説した。さらには既成ツールを越えて自分で設計したい人のためにも役に立つ本格的入門書である。

多変量統計解析法の表紙

多変量統計解析法

田中豊(統計学)/脇本和昌 ・現代数学社

データ解析の実際の表紙

データ解析の実際

奥喜正/高橋裕(経営学) ・丸善プラネット

本書はビジネスの企画・調査やアカデミックな研究で幅広く使われる多次元尺度法、因子分析、そして回帰分析を解説。仕組みを「知って使う分析者」になるための情報源。

統計的学習の基礎の表紙

統計的学習の基礎

Trevor Hastie/Robert Tibshirani/Jerome Friedman/杉山 将/井手 剛/神嶌 敏弘 ・共立出版

機械学習とは,コンピュータに学習能力を持たせるための方法論を研究する学問の名称であり,もともとは人工知能分野の一部として研究されていた。その後,機械学習は統計学と密接な関わりを持つようになり,「統計的学習」として独自の発展の道を歩み始めた。そして,1990年代から現在に至るまでの計算機やインターネットの爆発的な普及と相まって統計的学習の技術は目覚ましい発展を遂げ,いまや情報検索,オンラインショッピングなど,われわれの日常生活とは切り離すことのできない情報通信技術の根幹を支える重要な要素技術の一つとなった。  本書は,このような発展著しい統計的学習分野の世界的に著名な教科書である“The ...

確率モデルの基礎の表紙

確率モデルの基礎

遠藤靖/著 ・東京電機大学出版局

金融工学に不可欠な確率モデルを平易に解説した  「ファイナンスのための確率微分方程式」などの金融工学関連書籍を理解するために必要な「確率モデル」を基礎から解説.高校数学でも扱うごく初歩的な集合演算から解説を始めているので,数学の専門的な知識を前提とせずに読み進めることができる.また,第10章で株価モデルを論じているように,金融工学への導入までを視野に入れた内容としている.ファイナンスを学ぶ学生や業務とするビジネスマンのための一冊である.

ロバスト統計の表紙

ロバスト統計

藤澤 洋徳 ・近代科学社

<big><strong>外れ値に強い統計!</big></strong>  日本有数の統計研究機関である、統計数理研究所のシリーズ第6巻。本書は、これまでは無視されることが多かった外れ値に対する統計手法を解説する本格的な書である。具体的には、M推定、線形回帰モデル、多変量解析、ロバスト検定など、ロバスト統計で王道とされる各手法を紹介する。  統計の研究者はもちろん、統計を駆使する実務家も必読の書。 1.ロバスト統計とは 2.簡単なロバスト推定 3.M推定に基づいたロバスト推定 4.線形回帰モデル 5.多変量解析 6.ランク検定 7.パラメータ推定アルゴリズム 8.ロバストネスの尺度 9...

頑健回帰推定の表紙

Robust statistics

Huber,PeterJ./著 Ronchetti,Elvezio/著 RonchettiElvezioM./著 ・Wiley

A new edition of the classic, groundbreaking book on robust statistics Over twenty-five years after the publication of its predecessor, Robust Statistics , Second Edition continues to provide an authoritative and systematic treatment of the topic. This new edition has been thoroughly updated an...

数理統計学の基礎の表紙

Theory of point estimation : hbk

Lehmann,E.L.(ErichLeo),1917- Casella,George ・Springer

パターン認識と機械学習 上の表紙

パターン認識と機械学習 上

C.M.ビショップ ・丸善出版

2006年出版以来、amazon.comの人工知能部門で世界的トップセラーとなり、たちまち4刷となった英語版原著Pattern Recognition and Machine Learning、待望の日本語版。5名の監訳者のもと、選りすぐられた日本人研究者達14名によって丁寧に訳出。ベイズ理論に基づいた統一的な視点から、機械学習とパターン認識の様々な理論や手法を解説。

パターン認識と機械学習 下の表紙

パターン認識と機械学習 下

C.M.ビショップ ・丸善出版

ベイズ理論に基づく統計的予測技術は、計算アルゴリズムの開発と計算機の性能向上により、近年、急速に進展してきた。本書は、このベイズ理論に基づいた統一的な視点から、機械学習とパターン認識の様々な理論や手法を解説した教科書。この下巻では上巻の基礎的な話題を発展させた様々な手法を扱う。まず、予測精度の高さで注目を集めたサポートベクトルマシンと、今や幅広い領域で使われているカーネル法を説明。次に高度な確率モデルを表現するベイジアンネットなどのグラフィカルモデルや、潜在変数を扱うEMアルゴリズムを紹介。その後、ベイズ理論の適用範囲を広げた変分ベイズ法とMCMC法について触れ、次元削減や時系列の扱いと...

テキストアナリティクスの表紙

テキストアナリティクス

金 明哲 ・共立出版

本書は,テキストの電子化から始め,テキスト分析のための事前処理,目的に合わせた分析項目の集計方法およびそのテキストの分析方法などについて,例を織り込みながら,テキスト分析に関わる統計的データ処理や機械学習的手法について平易に解説している。  テキストにおける法則と指標,テキストの特徴分析,テキストのクラスター分析,テキストの分類分析,テキスト関連の予測や要因分析に分けて,伝統的な方法から最新の方法まで順を追って解説している。例えば,特徴分析では主成分分析,対応分析などの統計的データ分析法から始め,NMF(非負行列因子分解)分析やトピックモデルなどの機械学習的手法まで,分類分析では線形判別...

欠測データ処理の表紙

欠測データ処理

高橋 将宜/渡辺 美智子 ・共立出版

一般的に調査・観測データには欠測が生じることが多く,適切な欠測データの処理をしなければ,解析結果に偏りが生じることがある。多重代入法は,尤度解析法と並んで最も汎用的な欠測データ解析法であるが,これまでの書籍では理論的な解説が主で,実際の応用事例や具体的な手順の記述が少なかった。そのため,実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。  本書は,ワンポイントとして代入法を中心に解説している。平均値のt検定,重回帰分析,ロジスティック回帰分析,時系列分析,パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して,データに欠測が生じている...

ゼロから作るDeep Learningの表紙

ゼロから作るDeep Learning

斎藤 康毅 ・オライリー・ジャパン

実際にシステムを作りながらディープラーニングを学ぶ! ディープラーニングの本格的な入門書。外部のライブラリに頼らずに、Python 3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。ディープラーニングやニューラルネットワークの基礎だけでなく、誤差逆伝播法や畳み込みニューラルネットワークなども実装レベルで理解できます。ハイパーパラメータの決め方や重みの初期値といった実践的なテクニック、Batch NormalizationやDropout、Adamといった最近のトレンド、自動運転や画像生成、強化学習などの応用例、さらには、なぜディープラーニングは優...

機械学習のための特徴量エンジニアリングの表紙

機械学習のための特徴量エンジニアリング

Alice Zheng/Amanda Casari/株式会社ホクソエム ・オライリー・ジャパン

機械学習や人工知能の性能を決める特徴量作成・変換/選択について詳述した書籍! 本書は、機械学習を行うエンジニアが知るべき特徴量抽出の基本から応用、最新のテーマまでを網羅した書籍です。内容としてはそれほど難しくないため、機械学習を学んでいる人が特徴量エンジニアリングについて学びはじめる書籍として最適です。

入門実験計画法の表紙

入門実験計画法

永田靖 ・日科技連出版社

実験計画法は、「どのようにデータを取るか(実験を行うか)」「得られたデータをどのように解析するか」の両者を適切に取り扱うための方法論である。本書では伝統的な実験計画法の入門的な手法を一通り取り扱っており、その内容自体はオーソドックスである。データ採取の考え方と方法を例題ごとに具体的に明記し、プーリングや推定・予測の考え方など、従来のテキストではあいまいに記述されることの多かった内容についても具体的に解説、データの構造式を重要視した。

機械学習のエッセンスの表紙

機械学習のエッセンス

加藤 公一 ・SBクリエイティブ

本書は具体的なデータ分析の手法を説明する意図で書かれたものではありません。 実用的な目的ならscikit-learnやChainerなどの既存のフレームワークを使うべきですが、本書では機械学習のいくつかの有名なアルゴリズムを、自分でゼロから実装することを目標としています。こうすることにより、とかくブラックボックスになりがちな機械学習の仕組みを理解し、さらなる応用力と問題解決力を身につけることができるようになります。 また、処理系にはデファクトスタンダードであるPythonを使い、機械学習に必要な数学の知識もわかりやすく解説しています。 これから機械学習を始める学生さんや、いきなりプロジェ...

工学のための関数解析の表紙

工学のための関数解析

山田功 ・数理工学社

様々な場面で強力な手法を発揮する関数解析について、応用の重要性がどこにあるのかを熟知した工学の最前線の研究者が、工科系学生向きに基礎とその発展を解説。準備となる基本的な事項の解説から、情報工学分野での応用が急速に拡大している非線形解析の入り口までカバー。議論の動機や種々の事項の意味・恩恵も解説し、読み進めるうちに関数解析のセンスが養われ、理解が深まるよう配慮。章末に豊富な演習問題も付した。

効果検証入門〜正しい比較のための因果推論/計量経済学の基礎の表紙

効果検証入門〜正しい比較のための因果推論/計量経済学の基礎

著=安井翔太、監修=株式会社ホクソエム ・技術評論社

ビジネスで利用されるデータの多くは、その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には、DM送付などの広告施策であれば、担当者はユーザの反応率を上げるために、反応しやすいであろうユーザに対してのみDMを発送します。ここで発生したデータでDMの効果を計る場合、単純にDMを受け取っているか否かで結果を比較することは、DMの効果以外にも意図的にリストされたユーザの興味や関心を含んでしまうことになります。 データが生まれるプロセスに人の意思が関わる場合、単純な集計では判断ミスとなる可能性があります。わずかな計算の狂いでも後々のビジネスにおいて大きな影響を及...

ベイズ統計の理論と方法の表紙
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践の表紙

[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践

Sebastian Raschka;Vahid Mirjalili/株式会社クイープ 訳/福島 真太朗 監訳 ・インプレス

本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版では13〜16章の内容をほとんど刷新したほか、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。

このバックナンバーをシェア

X LINE Facebook はてブ