以下の内容はhttps://anton0825.hatenablog.com/entry/2017/12/08/000000より取得しました。


TF-TRTとTRTではTRTの方が速い(恐らく)

TensorRT周りは色々ややこしい。。 TensorFlowに組み込まれたTensorRTがあり、これをTF-TRTという。 TensorRT(TRT)はNVIDIAが開発している深層学習を高速に推論するためのライブラリ。

TF-TRTはTensorRTが対応している部分のみTensorRT化して推論する。 ここで気になるのはモデルのすべての層がTensorRTに変換できる時に、 TF-TRTを使った場合とTRTを使った場合で速度差があるか。

以下ではNVIDIA公式アカウントがTRT vs TF-TRTのベンチマークを取っている途中だと書いてあるが続報はなし。

forums.developer.nvidia.com

見つけた中では以下で速度比較がされていた。これによるとTRT>TF-TRT>TFになり、それぞれの速度差も無視できる範囲ではなさそう。 ただし、すべての層がTensorRTに変換できているかは不明。

https://on-demand.gputechconf.com/gtc-cn/2019/pdf/CN9456/presentation.pdf




以上の内容はhttps://anton0825.hatenablog.com/entry/2017/12/08/000000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14