質問応答("Multilingual Natural Language Applications: From Theory to Practice"より)

(Schlaefer and Chu-Carroll, 2012) Nico Schlaefer, Jennifer Chu-Carroll: "Question Answering", Book chapter in "Multilingual Natural Language Applications: From Theory to Practice". Pearson, 2012. を飛ばして読んだ。質問応答 1.1 導入と歴史 …

sbtからのREPLメモ

sbtのバージョンは、0.12.1。 REPLは、consoleで起動。 他は:helpの内容をコピペしておく。All commands can be abbreviated, e.g. :he instead of :help. Those marked with a * have more detailed help, e.g. :help imports.:cp add a jar or directory t…

テキストからの知識獲得の方法

どういった関係(知識)を抽出するのか? 上位下位関係 部分全体関係 因果関係 先後関係同一性・同義語・異表記語 反意関係 カテゴリ 修飾関係 属性 ライバル関係 etc. どういった手法があるのか? 文脈類似度 同一文内の共起パターン 同一談話内の項の共有 …

尺度水準

同一性 順序性 加法性 等比性 (頻度) (大小) (加減) (乗除) 名義尺度 ○ × × × 順序尺度 ○ ○ × × 間隔尺度 ○ ○ ○ × 比例尺度(絶対零点) ○ ○ ○ ○ 詳しくは、 http://www.motorwarp.com/koizumi/scale.htmlリッカート尺度(順序尺度) 提示された文に…

MappedOneToMany

MappedOneToManyは、同じ2テーブル間で同じ方向に一対多関係を複数設置しても実体はMappedForeignKeyなのでどれも同じものとして扱われる。例えば、次のような設計はアンチパターン。 class Counter extends LongKeyedMapper[Counter] with IdPK with OneTo…

TableSorter

I tried to use the TableSorter Lift Widget (lift 2.4M5). According to the tutorial (http://oss.infoscience.co.jp/scala/www.assembla.com/wiki/show/liftweb/TableSorter.html), I could have activated it by this code. TableSorter("#table_id")So…

MappedDateTime, MappedDate and MappedTime's format methods

MappedDateTime, MappedDate and MappedTime's format methods use LiftRules.dateTimeConverter's format methods (formatDateTime(d : Date), formatDate(d) and formatTime(d)) which use the following formatters respectively.def formatDateTime -> d…

S.findCookie and S.addCookie are malfunctioning.

Lift 2.4M5 Scala 2.9.1S.addCookie(HTTPCookie("your.cookie.name", Full(S.locale), Full(S.hostName), Full(S.contextPath), Full(2629744), Full(1), Empty, Empty)) doesn't work.S.addCookie(HTTPCookie("your.cookie.name", S.locale).setPath(S.cont…

i18n ISO

i18nで使われる国際規格をまとめる。 言語:ISO 639、あるいはJavaのロケール http://java.sun.com/javase/ja/6/docs/ja/technotes/guides/intl/locale.doc.html 国:ISO 3166-1 (+ISO 3166-3) Google MapsではccTLDが使われてる。 地域:ISO 3166-2 通貨:I…

確率過程

確率過程(Stochastic Process)有名な確率過程をメモ。 Bernoulli process Dirichlet process (←ノンパラベイズ) Gaussian process Ito process Markovian process Ornstein-Uhlenbeck process Poisson process Wiener process

postal codes

USA [0-9]{4}\\-?[0-9]{5} C1 UK [A-Z][0-9][A-Z][ ]?[0-9][A-Z][0-9] C184 Sweden [0-9]{3}[ ]?[0-9]{2} C167 Germany [0-9]{5} C65 Australia (0?|[1-9])[0-9]{3} C10 Austria [0-9]{4} C11 Japan [0-9]{3}\\-?[0-9]{4} C85 China [0-9]{6} C37 Taiwan [1-…

サードパーティのjarをmaven2のpom.xmlに追加する方法

以下のページが参考になったので備忘録としてコピペしておく。 http://ameblo.jp/one-of-the-wnet/entry-10112121909.html <dependency> <groupId>groupId_name(何でもいい)</groupId> <artifactId>artifactId_name(何でもいい)</artifactId> <version>version_No(何でもいい)</version> <scope>system</scope> <systemPath>jarのあるパス</systemPath> </dependency> jarのパスは…

Webアプリ開発環境構築の備忘録

Lift2.4-M4でWebアプリをインターネット上に公開しながら開発する環境を作った。 「ファイル転送にGitを使う。」 Gitを使ってサーバにファイルのアップロードをすると高速。SSHで公開鍵認証するので安全。FTP(&NCFTP)も入れてみたけどいらないね。 「SSHから…

Countries

_root_.net.liftweb.mapper.Countriesのval C1-C272の中身を一覧にする。 C1 United States C2 Afghanistan C3 Albania C4 Algeria C5 Andorra C6 Angola C7 Antigua and Barbuda C8 Argentina C9 Armenia C10 Australia C11 Austria C12 Azerbaijan C13 Bah…

Liftはじめるときのコマンド

mvn archetype:generate \ -DarchetypeGroupId=net.liftweb \ -DarchetypeArtifactId=lift-archetype-basic_2.9.1 \ -DarchetypeVersion=2.4-M4 \ -DarchetypeRepository=http://scala-tools.org/repo-releases \ -DremoteRepositories=http://scala-tools.o…

紀元前後情報と年月日情報からの曜日特定

メリットは特にないと思いますがjava.util.Calendar.*を使わずに、CE/BCE(紀元前後)情報と年月日情報から曜日を特定し出力します。1582CEの10月5日から14日までは存在しません。それ以前はJulian暦、それ以後はGregorian暦を採用します。実際にJu…

二つの文字列の類似度

雑な備忘録なので、サーベイの前準備程度にお使いください。 二つの文字列の類似度を測る方法についてまとめる。なお、値が高いほど類似度が高いものには青色、値が高いほど類似度が低いものには赤色で色付けた。 なお、意味レベルまで考慮して単文あるいは…

三大紙のニュースページからの記事抽出

三大紙(:朝日、毎日、読売)のニュースサイトからクロールされたwebページから、記事を抽出するプログラムを書いた。1つのニュースページからの抽出物は次の3つ 記事タイトル 更新時間 記事内容(画像なし) 実験のためのデータ集めで急いで書きました。…

Googleニュース(日本語)のRSS2.0フィードとAtomフィード

ここ→http://d.hatena.ne.jp/Gimite/20061205/1165287606 にかかれているtopicについて次の表でまとめた。 トピック名 topic= トップニュース h 社会 y 国際 w ビジネス b 政治 p エンタメ e スポーツ s テクノロジー t ピックアップ ir 話題のニュース po …

JenaでRDFaを読み込む

JenaのGRDDL ReaderというRDFaパーサがバグで使えないので、shellac/java-rdfa:https://github.com/shellac/java-rdfaを代用し、以下のように実装すると、 try{ Class.forName("net.rootdev.javardfa.jena.RDFaReader"); Model model = ModelFactory.createD…

簡単な英単語チェックプログラム

C++

自分のTOEFL対策のために作ってみた。仕様説明。 英単語を覚えているかを端末上でチェックするソフト。 トピックIDを打つとそのトピックの英単語がひとつ表示される。 表示の順序には2モードあり、単語帳順に表示するseqモードとランダムに表示するrandモー…

理系必見のSF映画

個人的に、理系なら一度は見ておきたいと思ったSF映画を並べてみる。SFの金字塔3作 ・ブレードランナー -チューリングテスト ・2001年宇宙の旅 -HAL ・惑星ソラリス - ・ガタカ -生体認証 ・トロン -未来のプログラミング ・アイアンマン2 -ホログラムUI …

いらん本

国大電情の教科書などよければお譲りします。電子情報工学科または数物・電子情報系学科の教科書 ・微分方程式 矢野健太郎 ・基礎からわかる物理学 熱力学 君嶋義英 ・基礎からわかる物理学 力学 栗田進・小野隆 ・回路の応答 武部幹 ・回路の応答演習 武部…

夏休みぷるむる勉強会

「本の紹介」 ↓原書 Christopher M. Bishop "Pattern Recognition and Machine Learning (Information Science and Statistics)"(Oct. 2006) ↓initialism PRML ↓+u母音 ぷるむる ↓ 2006は古く感じるけど機械学習のバイブル的存在らしい 例えば、今年Googleが…