以来 最初の論文 この技術が環境に与える影響を研究することは3年前に発表され、研究者の間で、彼らの仕事から消費されたエネルギーと排出されたエネルギーを自己報告する動きが高まっています。 正確な数値を取得することは、変更を加えるための重要なステップですが、実際にそれらの数値を収集することは困難な場合があります。
「測定できないものを改善することはできません」と、 アレン人工知能研究所 シアトルで。 「排出量の削減を進めるための最初のステップは、適切な測定値を取得する必要があることです。」
そのために、Allen Instituteは最近、Microsoft、AI企業のHugging Face、および3つの大学と協力して作成しました。 電気使用量を測定するツール MicrosoftのクラウドサービスであるAzureで実行される機械学習プログラムのこれにより、新しいモデルを構築するAzureユーザーは、モデルの選択からトレーニング、使用まで、プロジェクトのすべてのフェーズで、グラフィックスプロセッシングユニット(GPU)(計算を並行して実行するための専用コンピューターチップ)によって消費される総電力を表示できます。 。 これは、機械学習プログラムのエネルギーへの影響に関する情報へのアクセスをユーザーに提供する最初の主要なクラウドプロバイダーです。
ローカルサーバーで実行されている機械学習アルゴリズムからのエネルギー使用量と排出量を測定するツールはすでに存在しますが、研究者がMicrosoft、Amazon、Googleなどの企業が提供するクラウドサービスを使用する場合、これらのツールは機能しません。 これらのサービスでは、ユーザーがアクティビティで消費するGPU、CPU、メモリリソースを直接確認することはできません。また、Carbontracker、Experiment Tracker、EnergyVis、CodeCarbonなどの既存のツールでは、正確な見積もりを提供するためにこれらの値が必要です。
10月にデビューした新しいAzureツールは、現在、排出量ではなくエネルギー使用量を報告しています。 そこで、ダッジと他の研究者は、エネルギー使用を排出量にマッピングする方法を考え出し、彼らは コンパニオンペーパー その仕事で FAccT、6月下旬の主要なコンピュータサイエンス会議。 研究者はというサービスを利用しました ワットタイム 11の機械学習モデルを実行しているクラウドサーバーの郵便番号に基づいて排出量を推定します。
彼らは、研究者が特定の地理的な場所で特定の時間帯にサーバーを使用すると、排出量を大幅に削減できることを発見しました。 グリッド上でより多くの再生可能電力が利用できるときにトレーニングを開始すると、小型の機械学習モデルのトレーニングからの排出量を最大80%削減できます。一方、再生可能エネルギーのときにトレーニング作業を一時停止すると、大型モデルからの排出量を20%以上削減できます。電気は不足していて、それがより豊富になると再開されます。