駄文型

プログラミングとか英語とかの話題を中心にした至極ちゃらんぽらんな日記です。

Pandas.DataFrame (Python) 風のクラスを作って rubygem として公開した

ruby には CSV::Table があるので、基本的なことはできるが、 PandasDataFrame.read_csv のように多機能な CSV の読み込みメソッドが(多分)なかったので、 Pdtable::Table という CSV::Table を拡張したクラスを Gem で作って公開した。はじめは CSV の読み込みを行うメソッドだけのモジュールとして作っていたが、拡張して Pandas の DataFrame のように多機能なクラスにすることもあるかも、と思って CSV::Table の拡張クラスとした。

github.com

pdtable | RubyGems.org | your community gem host

続きを読む
広告を非表示にする

なぜ日本の「ものづくり」は復活しないか

GE 巨人の復活 シリコンバレー式「デジタル製造業」への挑戦 という本を読んだ。 2015年に160億ドルの特別損失を計上したゼネラル・エレクトリック(GE)が、いかにして復活を遂げたかをまとめたものだ。 GE はベイエリアシリコンバレーと呼ばれる地域のテクノロジー企業の文化を模倣し、復活した。ベイエリア式の文化とはすなわち、「リーンスタートアップ」であり、「デザイン思考」であり、「アジャイル」であり、「OSS」である。

続きを読む
広告を非表示にする

ITエンジニアが採用試験の技術課題に挑む前に確認すること

Macbook

ITエンジニアの中途採用において、多くの会社は技術問題を課したり面接で技術的な知識があるかどうか確認する。コンピュータサイエンスのすべての分野に精通している必要はないが、基本は抑えておきたい。前回の転職で得た知見をまとめておこうと思っていたのだが、1年経ってしまった。

ここで挙げている項目は、ややデータエンジニアよりの内容だが、開発系のエンジニアにも参考になると思う。

続きを読む
広告を非表示にする

大量のファイルを Shift-JIS から UTF-8 に変換する

データ分析やっていきましょう!と託された大量の CSV ファイルが Shift-JIS でつらい。 UTF-8 に変換したかったのだが、色々試す必要があった。

続きを読む
広告を非表示にする

ストリーム処理で文章内にある単語の出現頻度をカウントする(Apache Apex) その2 -コーディング編-

ストリーム処理で文章内にある単語の出現頻度をカウントする(Apache Apex) - 駄文型 の続き。前回は環境構築や実行のみを行い、サンプルコードの中身までは触れていない。そこで今回はサンプルコードを読み解き、 Apex ストリーミングアプリケーション開発の雰囲気を掴んでいく。

続きを読む
広告を非表示にする

ストリーム処理で文章内にある単語の出現頻度をカウントする(Apache Apex)

Stream

続きを読む
広告を非表示にする