Schnellere Inferenz auf CPUs dank weniger präziser Modellparameter.

Ein umfangreicher Vergleich verschiedener Methoden zur Beschleunigung der Inferenz von ML-Modellen auf CPUs.

Wie ich einen minimalistischen Blog erstellt habe, ohne mir Sorgen über unerwartete Cloud Kosten machen zu müssen.