LINEスタンプ制作代行サービス・LINEスタンプの作り方!

お電話でのお問い合わせ:03-6869-8600

stampfactory大百科事典

FLOPS

FLOPS(フロップス、"Floating-point Operations Per Second")はコンピュータの性能指標の一つ。1秒間に浮動小数点数演算が何回できるか数値の大きさだけでなく、理論的に算出された値の何%で実際のプログラムが動作するかということも重要である。実際の値が理論値に近いほど、より効率的なコンピュータだと考えられるからである(これを強調しすぎると、効率を高くするには演算器の数を減らすなどによって性能の理論上限値を下げさえすれば良いなどということになりがちではあるが)。パーソナルコンピュータ(以下パソコンと略)向けのCPUやGPUメーカーは計算ノードとしては単一のノードとなるので通常理論値で発表する(理論値がほぼそのまま実効値となる)が、一般的に並列方式スーパーコンピューターでは多数の計算ノードのクラスタとして構築されるため、実際の計算能力を理論値に近づけるには高度な運用能力が必要であり、理論値ではなく LINPACK ベンチマークでの実測値がよく使われている(但しLINPACK値はもてはやされているが、それが計算機の能力の全てではまったくなくて、性能のある一つの切り口からみた指標に過ぎない)。現在、家庭用のパソコンの CPU は GFLOPS、スーパーコンピュータの世界1位は PFLOPS の単位であるが、ムーアの法則にそって高速化が進んでおり、2018年に並列度1億でLINPACK性能値はEFLOPSの単位に到達すると予想されている。パソコンとスーパーコンピュータの差はおおよそ1万倍の差で推移している。Core 2 Duo より1クロックで SSE で加算と乗算が計算できるようになり 128 ビット幅だと倍精度で 4 FLOPS/Clock。Sandy Bridge より搭載した Intel AVX は 256 ビット幅なので 8 FLOPS/Clock。Intel AVX 2 は FMA 命令の導入により 1 cycle で2つの FMA が実行できるので 16 FLOPS/Clock。単精度だと、これらの演算回数は2倍。Atomは1クロックで1つのSSE加算命令が、2クロックで1つのSSE乗算命令が実行できるため、合計すると倍精度で3 FLOPS/Clockとなる。Bulldozer は1モジュールにつき2つの128ビット積和演算器があり、倍精度は2つのFMA命令を同時実行することにより 8 FLOPS/Cycle。ARM NEON はCortex-A15までは倍精度が扱えなく、単精度のみ。ARM NEON は 128ビット幅で単精度だと 4 FLOPS/Cycle だが、Cortex-A15 は FMA があるので 8 FLOPS/Cycle。倍精度は、Cortex-A9 は VFPv3 により、2 cycle で足し算2回、乗算1回、合計3演算できるので、1.5 FLOPS/Cycle。Cortex-A15 は VFPv4 により、1 cycle で1回 FMA が計算できるので、2 FLOPS/Cycle。Cortex-A57より、NEONでも倍精度が扱えるようになる。単精度の積和算を 2 FLOPS/Clock で行える。ハイエンドでは倍精度(fp64)は 0.5 FLOPS/Cycle であるが、ミドルレンジ以下は 0.125 FLOPS/Cycle であったり、倍精度の計算が出来なかったりする。HD Graphicsの各EUは4-way SIMDの演算器を備えており、1命令で4並列の単精度浮動小数点演算が可能である。Sandy Bridgeより前の世代では1クロックでEUあたり1つの加算もしくは乗算命令を実行可能で、4FLOPS/EU。Sandy Bridge世代では1クロックでEUあたり1つのFMA命令を実行可能で、8FLOPS/EU。Ivy Bridge世代以降は1クロックでEUあたり2つのFMA命令を実行可能で、16FLOPS/EUとなる。

出典:wikipedia

LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。