2011-01-01から1年間の記事一覧

紀元前後情報と年月日情報からの曜日特定

メリットは特にないと思いますがjava.util.Calendar.*を使わずに、CE/BCE(紀元前後)情報と年月日情報から曜日を特定し出力します。1582CEの10月5日から14日までは存在しません。それ以前はJulian暦、それ以後はGregorian暦を採用します。実際にJu…

二つの文字列の類似度

雑な備忘録なので、サーベイの前準備程度にお使いください。 二つの文字列の類似度を測る方法についてまとめる。なお、値が高いほど類似度が高いものには青色、値が高いほど類似度が低いものには赤色で色付けた。 なお、意味レベルまで考慮して単文あるいは…

三大紙のニュースページからの記事抽出

三大紙(:朝日、毎日、読売)のニュースサイトからクロールされたwebページから、記事を抽出するプログラムを書いた。1つのニュースページからの抽出物は次の3つ 記事タイトル 更新時間 記事内容(画像なし) 実験のためのデータ集めで急いで書きました。…

Googleニュース(日本語)のRSS2.0フィードとAtomフィード

ここ→http://d.hatena.ne.jp/Gimite/20061205/1165287606 にかかれているtopicについて次の表でまとめた。 トピック名 topic= トップニュース h 社会 y 国際 w ビジネス b 政治 p エンタメ e スポーツ s テクノロジー t ピックアップ ir 話題のニュース po …

JenaでRDFaを読み込む

JenaのGRDDL ReaderというRDFaパーサがバグで使えないので、shellac/java-rdfa:https://github.com/shellac/java-rdfaを代用し、以下のように実装すると、 try{ Class.forName("net.rootdev.javardfa.jena.RDFaReader"); Model model = ModelFactory.createD…

簡単な英単語チェックプログラム

C++

自分のTOEFL対策のために作ってみた。仕様説明。 英単語を覚えているかを端末上でチェックするソフト。 トピックIDを打つとそのトピックの英単語がひとつ表示される。 表示の順序には2モードあり、単語帳順に表示するseqモードとランダムに表示するrandモー…

理系必見のSF映画

個人的に、理系なら一度は見ておきたいと思ったSF映画を並べてみる。SFの金字塔3作 ・ブレードランナー -チューリングテスト ・2001年宇宙の旅 -HAL ・惑星ソラリス - ・ガタカ -生体認証 ・トロン -未来のプログラミング ・アイアンマン2 -ホログラムUI …

いらん本

国大電情の教科書などよければお譲りします。電子情報工学科または数物・電子情報系学科の教科書 ・微分方程式 矢野健太郎 ・基礎からわかる物理学 熱力学 君嶋義英 ・基礎からわかる物理学 力学 栗田進・小野隆 ・回路の応答 武部幹 ・回路の応答演習 武部…

夏休みぷるむる勉強会

「本の紹介」 ↓原書 Christopher M. Bishop "Pattern Recognition and Machine Learning (Information Science and Statistics)"(Oct. 2006) ↓initialism PRML ↓+u母音 ぷるむる ↓ 2006は古く感じるけど機械学習のバイブル的存在らしい 例えば、今年Googleが…