2008年07月07日 (月)
SSE3までを使って、RGB24bit 画像を輝度変換する
64 bit 環境決め打ちで書いています。SSE3 は lddqu という、メモリ読み出し命令を使っているので、それを単純に movqdu に置き換えれば SSE2 までです。後段で扱いやすいように 16bit データのままで書き出しています。
- 並び替えず
- brightness2.cpp
- 並び替える
- brightness3.cpp
- Cでunloop
- brightness4.cpp
並び替えないコードが最速で、手元の環境では C で 16回 unloop に対して 2 割近く高速化できました。SSE による SIMD 演算よりも、movntdq、prefetchnta でキャッシュまわりの対策が効果を上げています。もっと最適化できるのかも。
8bit のまま、普通に C で書いたものの方が早いので、そちらを使って、後段で unpack するのが正解かなぁ。とりあえず、現時点ではぱっと改善箇所は思いつかない。
才能の無駄遣い
プロの犯行としか思えない、無駄にクオリティの高い3DCG動画が。せんとくんの表情が凄いよ・・・。内容の善し悪しはさておきw。
|
1:06 |
せんとくんで「ハレ晴レキモイ」【3D】 奈良県民ざまああああ 奈良への侮辱すぎるw 奈... |
前にちょっと話題になった↓といい、下手な商業作品よりクオリティ高いんじゃないか?と思う今日この頃。
|
1:33 |
らき☆すた+涼宮ハルヒの憂鬱(完成版) wwwwwwwww ほんもの プロだwww 作者に同人のキャラ以 |



