画像処理プログラムへの適用例

並列化対象プログラムと受託並列化の概要

  • 7000行程度の静止画像処理プログラム
  • MATLAB/Simulinkによってモデルベース設計されたCコード
  • 当社によるCコードチューニング + OSCARTech®コンパイラで自動並列化
  •   ― データ依存関係低減のために構造体メンバ配列をリネーミング

実行速度と速度向上率

  • IntelR XeonR CPU X5670、2.93GHz (4 core)での検証結果

解析:並列性の可視化(マクロタスクグラフ)

  • 480のタスクを自動抽出
  • コンパイル前のチューニングによってプログラムそのものが備える並列性を向上


図:構造体メンバ配列リネーミング前後の並列性の比較

解析:並列性の可視化(ガントチャート)

  • 480のタスクの実行時間や依存関係に応じて各コアへ自動割り付け
  • 実行時のボトルネックをビジュアルに確認可能、必要に応じてオリジナルのプログラムをチューニング


図:OSCARTech®コンパイラによる自動割り付け結果の可視化(ガントチャート)

応用

  • 画像認識、動画処理プログラムの自動並列化による高速化

お問い合わせ

受託並列化サービス(高速化・省電力化)をご検討中のお客様はお問い合わせください。
各種の機器組み込みプログラム、制御プログラム、数値シミュレーションプログラム等への適用実績があります。