はてダで「project euler を scheme で解く」にチャレンジしています。
ご興味のある方は遊びに来てください。
はてダで「project euler を scheme で解く」にチャレンジしています。
ご興味のある方は遊びに来てください。
Processing.js、簡単に動くモノが作れて面白いです。ということで今日も processing.js でワチャゴナしてみました。
ここ最近で話題になった John Resig さんの processing.js を使ってみました。processing の存在は知っていましたが、Java ということで敬遠していました。しかし javascript であれば敬遠する理由はありません。ということで簡単に作れておもしろい 2 次元(といっていいのかなぁ)フラクタル図形であるところのシェルビンスキーのカーペットを描いてみました(他のフラクタル図形が簡単かどうかは知りません)。コードはこんな感じ。
processing 自体はサンプルとレファレンスを観ていたらすぐに分かりました。簡単なモノを作っておいて簡単というのもおかしな話ですが、processing.js の導入、processing 自体ともに簡単に馴染むことができました。おもしろそうです、コレ。
コードを貼り付けてボタンを押すとサーバサイドでコードを実行し、実行結果を表示してくれる codepad でちょっと遊んでみました。
何をして遊んだかというと、サーバの実行環境やコンパイル環境の事を知ることはできないだろうかと、実行ファイルの ELF(Executable and Linking Format) を読んでみました。 まず初めに こんな感じ で ELF header から OS/ABI 情報と CPU の情報を取得してみました。
結果は OS/ABI が 0 で ehdr.e_machine が 3。 ABI が 0 というのがよく分かりませんが、 ehdr.e_machine が 3 ということから i386 系 CPU ということが分かります。これは、手元の FreeBSD では elf.h から include を辿って sys/elf_common.h に define マクロが定義されていたので、そこから判断しました。分かったからどうということもないですが。
おまけでこちら。おそらく 4.1.2 というのはおそらく GCC のバージョンだと思われます。 こちらもだからなんだってことなんですけど。
次に .comment セクションに何か入ってないかなーと思い、ELF のセクションヘッダにも手を出してみました。セクションヘッダの構造は ここを参考にしました。書いたコードも晒しておきますが、実行したら seek が禁止されていて実行できませんでした。残念。
以下が .comment セクションを表示するプログラムです。時間があればコメントもつけたいところです。
「一部のHTMLタグを通すフィルタ」というお題に投稿してみました。 C は意外と言語別の一番乗りになりやすいかも。
libcurl の C++ ラッパライブラリ curlpp を使って HTTP 経由でコンテンツをやり取りしようという試みです。
ネット上の何処かにあるフィードのデータを整形して Twitter へ投げるような場合にはフィードのデータを GET する場合と、Twitter へ データを POST する。2つのパターンがありますが、まずは GET 編。
いきなり答えですが、単純に URL へ GET リクエストを送るという最小限のコードはこれだけ。
cleaner はコンストラタとデストラクタで cURLpp の初期化、終了化をやってくれるもの。 あとの 3 行はほぼ見たままなのだけど、setOpt の仕方が少々変わっていてのようにでファインマクロは使わなくなっています。 libcurl でいうところの CURL_OPT_XXXX のデファインに対応するクラスが cURLpp::Options に準備されているようです。そして、そのクラスのインスタンスを setOpt に渡すことで curl ハンドラの設定行います。
でも、これだと単に標準出力にコンテンツを出力しておしまいなので、画面に出さずにメモリに入れるようにしてみたいのですが、それにはURL を設定した行の下に下の 2 行を追加すれば大丈夫です。
ちょっと分かりにくいけど、データを受け取ったら CurlHandler::writeMemoryCallback にデータを渡すようにする設定です。 libcurl でいうところの CURLOPT_WRITEFUNCTION の設定です。libcurl のドキュメント には size_t function( void *ptr, size_t size, size_t nmemb, void *stream) とか書いてるわりに、curlpp では 4 つ引数のある関数は受け取ってもらえませんでしたので、3 つで我慢しました。この関数は一回のリクエストで何回呼ばれるかは保証されていませんので、呼ばれるごとに受信したデータを後ろに繋いでいく必要があります。こんな感じで:
以上で、ざーっと curlpp で GET してレスポンスのデータをメモリに代入するところまでやってきました。最後に全体を貼り付けておきます。前回は xpath で簡単に RSS からタイトルを抜き出す方法を書いたのですが、下記のようにデフォルトの名前空間が指定されている RSS1.0 では、xpath "//title/item" では 取得できないことが分かりました。
<rdf:RDF xmlns="http://purl.org/rss/1.0/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xml:lang="ja">
つまり、xpath "//item" は名前空間なしの素の item エレメントであって、デフォルト名前空間の下にある item という名前のエレメントにはマッチしないということらしいのです。じゃあどうやってそれを xpath で表すかというと、表す方法はないとか…あわわ。
ということで、以下のような感じでなんとかクリア。 get_children で地道に辿っていく方法もあるのですが、 RSS1.0 と 2.0 では item ノードの階層が違うので、共通で使えるコードとなると xpath の方が単純に書けていいと思います。厳密さを撮るか簡便さを取るか、ですね。
#include <iostream>
#include <libxml++/document.h>
#include <libxml++/parsers/domparser.h>
#include <libxml++/nodes/node.h>
#include <libxml++/nodes/element.h>
#include <libxml++/nodes/textnode.h>
using namespace std;
using namespace xmlpp;
int main ( void ){
DomParser parser;
parser.parse_memory( string_rss );
Element *root = parser.get_document()->get_root_node();
NodeSet items = root->find("//*[name()='item']");
for( NodeSet::iterator it = items.begin();
it != items.end(); it++ ){
const NodeSet value = (*it)->find( "//*[name()='title']" );
string title = dynamic_cast< Element *>(value[0])
->get_child_text()->get_content();
cout << "Title: " + title << endl;
}
return 0;
}
find ではなく get_children を使って書くと item の NodeList を取るのは以下のようになります。それほど複雑でもないので xpath に慣れていない場合はこっちの方が良いかも。
/* RSS 2.0 */
Node::NodeList items = root->get_children("item");
/* RSS 1.0 */
if( items.empty() ){
const Node::NodeList ch = root->get_children("channel");
if( ! ch.empty() ){
items = ch.front()->get_children("item");
}
} ちょっとしたプログラムを書くなら、開発の手軽さとライブラリの豊富さから考えても使う言語は Perl か PHP あたりのスクリプト言語になるのですが、一方で C や C++ のようなコンパイル言語を全く使わないかというと、実は全然そうでもなくて、とはいってももっぱら読む方が多いのですが、C++ のライブラリとかってあまり使ったことがないので、libxml の C++ ラッパライブラリの libxml++を使ってみました。
ドキュメントを読んで、RSS から title を抜き出すのを作ってみました。以下のような感じ。エラー処理とかは一切ないですが。
#include <iostream>
#include <libxml++/document.h>
#include <libxml++/parsers/domparser.h>
#include <libxml++/nodes/node.h>
#include <libxml++/nodes/element.h>
#include <libxml++/nodes/textnode.h>
using namespace std;
using namespace xmlpp;
int main ( void ){
DomParser parser;
parser.parse_memory( string_rss );
Element *root = parser.get_document()->get_root_node();
NodeSet items = root->find("//item");
for( NodeSet::iterator it = items.begin();
it != items.end(); it++ ){
const NodeSet value = (*it)->find( "title" );
string title = dynamic_cast< Element *>(value[0])
->get_child_text()->get_content();
cout << "Title: " + title << endl;
}
return 0;
}
get_root_node で ルートノードを取ってきた後は、ルートノードに対して find で欲しいノードを検索して、見つかったノードの集合をイテレータを使って各ノードにアクセスするという形です。 find は XPath を引数にして欲しいノードを取ってこれるので、 思っていたより簡単にできました。タイトルだけを抜き出すなら本当は find("//item/title") でも良いのですが、title の他にも link や pubDate を取ってきたいときは上記のような形になります。
とまあ、これだけでは何ですので、pipes で集約した RSS をポーリングして twitter に更新するプログラムを C++ で作って見ようかななんて思ったり思わなかったりしています。なので次回は curlpp の説明になるかもしれません。
最近のコメント