冷めたコーヒー

Weniger, aber besser

双対問題の作り方―LP の例―

双対問題の作り方

以下の最小化問題を考える:

\begin{align} (\text{P})\qquad\min_{x} &\quad f(x) \\ \text{subject to} &\quad g_i(x) \le 0 \quad (i=1,2,\dots,m). \end{align}

関数 $f,\,g_i$ に対する連続性や微分可能性は適当に性質の良いものを考えることにしておく.また,以下で min や max の操作を多用するが,それぞれの存在性を仮定しておく.

ラグランジュ関数 $L:\mathbb{R}^n\times\mathbb{R}^m\to\mathbb{R}$ を以下で定義する:

$$ L(x,\lambda) := f(x) + \sum_{i=1}^{m}\lambda_i g_i(x), \quad (\lambda \geq 0). $$

このとき,適当に $\lambda \ge 0$ を固定して元の問題 P に対する制約条件を "緩和" した次の最適化問題を考える:

\begin{align} (\text{P}(\lambda))\qquad\min_{x} &\quad L(x,\lambda) := f(x) + \sum_{i=1}^{m} \lambda_i g_i(x)\\ \text{subject to} &\quad x \in \mathbb{R}^n. \end{align}

この問題を問題 P に対する "ラグランジュ緩和問題" といい,P($\lambda$) で表すこととする.また,そのときの最適値関数を $L(\lambda)$ で表すこととする.すなわち,

$$ L(\lambda) := \min_x L(x,\lambda) $$

である.

問題 P に対する最適解を $x^\star$ とすると,$x^\star$ は問題 P の制約条件を満たすので

$$ f(x^\star) \ge f(x^\star) + \sum_{i=1}^{m} \lambda_i g_i(x^\star) = L(x^\star,\lambda) $$

を満たす.すなわち,最適化問題 P の最適値 $f(x^\star)$ は,ラグランジュ緩和問題 P($\lambda$) を解くことによってその下界値(ここでいうところの $L(x^\star,\lambda)$)を得ることができる.このとき,緩和に用いたラグランジュ乗数 $\lambda \ge 0$ によって得られる下界値が変わってくる.

そこで,最適なラグランジュ乗数 $\lambda^\star$ が何なのか気になってくる.どうすればよいかというと,ラグランジュ緩和問題の最適値関数 $L(\lambda)$ を $\lambda$ に関して最大化した問題を考えればよい.すなわち,以下の最大化問題:

\begin{align} (\text{D}(\lambda))\qquad\max_{\lambda} &\quad L(\lambda)\\ \text{subject to} &\quad \lambda \geq 0 \end{align}

を解いて得られる $\lambda$ が気になるわけであり,この D($\lambda$) が最適化問題 P に対する双対問題というわけである.

おまけ: LP の場合

標準的な LP に対するラグランジュ双対問題がどのように導出されるのか見てみよう.以下の LP を考える:

\begin{align} (\text{P})\qquad\min_{x} &\quad c^\top x \\ \text{subject to} &\quad Ax \ge b,\,x\ge 0. \end{align}

ラグランジュ関数 $L$ を以下で定義する:

$$ L(x,\lambda) := c^\top x + \lambda^\top(b-Ax), \quad (\lambda \geq 0). $$

ラグランジュ緩和問題は次のように書ける:

\begin{align} (\text{P}(\lambda))\qquad\min_{x} &\quad L(x,\lambda) := c^\top x + \lambda^\top(b-Ax) \\ \text{subject to} &\quad x \ge 0. \end{align}

ここで,$x$ に関する非負制約もラグランジュ関数に取り込んでラグランジュ緩和問題を $x$ に関する無制約問題としてもいいのだが,$x\ge 0$ を残しても同様の議論ができるのでこのまま進めることにする.さて,ラグランジュ緩和問題 P($\lambda$) の目的関数は $x$ の項と $\lambda$ の項について整理してあげると

$$ L(x,\lambda) = (c-A^\top \lambda)^\top x + b^\top\lambda $$

となり,$b^\top\lambda$ の部分は $x$ に依存しない.一方,$c-A^\top\lambda$ について,$(A^\top\lambda)_i < 0$ なる $i\in[m]$が存在すると,対応する $x_i$ の値を大きくすることで幾らでも目的関数値を改善することができてしまうので,$c-A^\top\lambda \ge 0$ であることが必要である.また,ラグランジュ緩和問題に対する最適値関数 $L(\lambda)$ は $L(\lambda):=\min\{L(x,\lambda)\mid x\ge 0\}$ で定義されるが,$\lambda$ に関する部分は $b^\top\lambda$ のみであることに注意すると,ラグランジュ双対問題は以下で定式化される:

\begin{align} (\text{D}(\lambda))\qquad\max_{\lambda} &\quad b^\top\lambda\\ \text{subject to} &\quad A^\top\lambda\le c,\,\lambda \geq 0. \end{align}

Overleaf 環境を Docker でローカルに構築する手順

github.com

  1. overleaf/toolkit を clone する
$ cd ~
$ git clone https://github.com/overleaf/toolkit.git ./overleaf
  1. 設定ファイルの作成用コマンドを実行する
$ cd overleaf
$ bin/init

以下が表示されれば OK:

Copying config files to 'config/'
  1. Overleaf を起動するコマンドを実行する
$ bin/up

※ 内部で docker-compose を呼んでいます.初回は 10 分程度の時間がかかります.

  1. localhost:80/launchpad を開き,アカウントを作成する.
HAPPY OVERLEAF LIFE !

Gurobi: HostID mismatch の対処法

本記事の内容は正確ではありません.後日修正をします.

TL;DR

  • OctoberSky Co., Ltd. に HostID mismatch が発生した旨を連絡し,新規でライセンス・キーコードを発行してもらう
  • 旧ライセンス・キーコードを削除し,新ライセンス・キーコードを所定の位置に配置する
  • gurobi.sh を実行し,gurobi が呼び出せることを確認する

バージョン情報

  • grbprobe version 9.5.1, build v9.5.1rc2
  • PLATFORM=linux64

何が起こったのか

ここにある通り,grbprobe を実行したときの HOSTID の値が,以前のものと変わっていました.これにより,ライセンス・キーコード gurobi.lic に記載されている HOSTID の値と一致しないために gurobi を呼び出すことができないという事象が発生しました.

解決まで

最初は自分の環境側で対処可能な事象だと思ったですが,話はそう単純ではなかったようで,Gurobi Optimizer の日本総代理店を務める OctoberSky Co., Ltd. へ上記の旨を連絡しました.ライセンス・キーコードが MAC アドレスと紐づいているようで,やはりインターネット回線の変更に伴い MAC アドレスが変更された(or した)ことが原因のようでした.

後は,メールのやり取りにて,マシン変更申込届の提出を促されるので,それに従います.必要な情報としては,grbprobe の実行結果とマシン変更申込届です.

Gurobi Optimizer は,いくつかの実行ファイルを使うのですが,これらのファイルが必要なときに参照できるようにするべく,いくつかの環境変数を修正する必要があります.このとき,(インストール先に依りますが)bash シェルのユーザであれば,.bashrc に以下の行を加える必要があります:

export GUROBI_HOME="/opt/gurobi951/linux64"
export PATH="${PATH}:${GUROBI_HOME}/bin"
export LD_LIBRARY_PATH="${LD_LIBRARY_PATH}:${GUROBI_HOME}/lib"

また,ライセンス・キーコードの差し替えにおいて,旧ライセンス・キーコードは削除した上で行いましょう.削除を行わない(e.g., リネーム)で差し替えを行うと,gurobi を呼び出したときに旧ライセンス・キーコードを読み取りに行ってしまい,HostID mismatch を起こします.これは,gurobi.lic に記載されている HOSTID の値と,grbprobe を実行して確認できる HOSTID の値が一致しているため,原因が分かりにくい事象であるのですが,きちんと旧ライセンス・キーコードを削除すると解消します.

Q&A

Q: gurobipy.GurobiError: HostID mismatch (licensed to xxxxxxxx, hostid is yyyyyyyy) というエラーが発生しました.どうすればいいですか.
A: gurobi.lic に記載されている HostID が手元の環境の HostID と合致していません.代理店へ連絡しましょう.

Q: Environment variable GUROBI_HOME is not set. というエラーが発生しました.どうすればいいですか.
A: 環境変数が正しく設定されていない可能性があります.もしくは,旧ライセンス・キーコードが残っている可能性があります.前者の場合は,作業時の注意 を参考に環境変数を設定してください.後者の場合は,旧ライセンス・キーコードを物理的に完全に削除してください.

『しっかり学ぶ数理最適化』演習問題(第 3 章)

『しっかり学ぶ数理最適化』第 3 章「非線形計画」の演習問題に関する個人的なメモ書きです.

3.1

二次正方行列の正定値性に関する等価な条件の導出の問題です.計算しましょう.

3.2-3.5

関数の凸性に関する問題です.3.2 は平均二乗誤差 $f(a, b) = \frac{1}{n} \sum_{i=1}^{n} (y_i - ax_i - b)^2$ の凸性を示す問題です.関数 $f$ の引数が $(a, b)$ であることに注意して,ヘッセ行列を計算し,その半正定値性を見てあげることによって示すことができます.具体的には,計算したヘッセ行列の二次形式を考えてあげて,その非負性を示せば十分です.3.3 は次の関数: \begin{align} f(x, y) = \max_{i\in [n]} \sqrt{(x_i - x)^2 + (y_i - y)^2} \label{1}\tag{1} \end{align} に関する凸性を示す問題です.ここで,$[n]$ は集合 $\{1,2,\dots,n\}$ を表すものとします.まず前提として,凸集合 $S$ 上で定義される凸関数 $f_1,\,f_2$ に対して,関数 $\max \{ f_1, \, f_2\}$ はまた凸関数であることが成り立ちます.この事実を繰り返し用いれば,$n$ 個の凸関数に対する $\max$ 値関数も凸関数であり,したがって,式 \eqref{1} で定義される関数の凸性を示すためには,$f_i (x,y) := \sqrt{(x_i - x)^2 + (y_i - y)^2}$ が凸関数であることを示せばよいです.書籍の解答では,3.2 と同様にヘッセ行列を計算して,その半正定値性を見ています.3.4 は $f(x) = \| x \|_2$ の凸性を示す問題で,書籍では勾配を用いた凸関数の特徴付けを用いて示しています.より簡単に,任意の $x,\,y\in\mathbb{R}^n$ と任意の実数 $\lambda\in [0,1]$ に対して,$\| \lambda x + (1-\lambda)y \|_2 \leqq \lambda\| x \|_2 + (1-\lambda)\| y \|_2$ が成立することを示してもよいと思います.これは,ノルムの性質より直ちに従います.3.5 はいわゆる log sum exp 関数と呼ばれる次の関数: \begin{align} f(x) = \log \left( \sum_{i=1}^{n} \mathrm{e}^{x_i} \right) \label{2}\tag{2} \end{align} の凸性を示す問題です.この関数は様々な分野で登場する関数で Wikipedia にもページがあります(LogSumExp).特徴を一つ述べておくと,関数 $f$ の $x_i$ に関する偏微分は \begin{align} \frac{\partial f(x)}{\partial x_i} = \frac{\mathrm{e}^{x_i}}{\sum_{j}\mathrm{e}^{x_j}} \end{align} となり,よく知られた softmax 関数になります.また,本書でも述べられているように $\max\{x_1,x_2,\dots,x_n\}$ を近似する場面でもよく使われます.さて,この関数の凸性ですが,本書ではやはりヘッセ行列を計算し,その半正定値性を見ています.また,こちらのページ で議論されているように,Hölder の不等式に帰着させて示すのも綺麗だと思いました.

3.6

面白い問題です.与えられた非凸最適化問題を上手く変形することによって等価な凸計画問題を導出する問題です.

3.7

無制約二次計画問題を勾配降下法によって解くアルゴリズムにおいて,勾配降下方向にどれくらい進むのかについて決定する最適化問題を解く問題です.具体的には,アルゴリズムの第 $k$ 反復における近似解 $x^{(k)}$,勾配降下方向を $d(x^{(k)})$ としたとき,ステップサイズ $\alpha (>0)$ を変数とする関数 $g(\alpha) := f(x^{(k)} + \alpha d(x^{(k)}))$ を最小化する最適化問題を解く問題です.

3.8

無制約凸二次計画問題ニュートン法で実際に解く問題です.実際に解くといっても,実装する必要はなく,解析的に計算することができる問題です.実際に勾配ベクトル,ヘッセ行列を計算し,与えられた初期点から勾配降下方向に点を移動させてみると更新後の点における勾配ベクトルは $0$ ベクトルとなり,最適性条件を満たすことが分かります.

3.9

制約付き最適化問題を解く問題です.最適性条件を考えることによって解くことができます.

3.10

二次計画問題の双対問題を導出する問題です.本書では,行列 $Q$ が正則行列となっていますが,正定値対称行列が正しいです.対称行列でない場合は,本書 pp.91 と同様の議論によって一般性を失うことなく対称行列に変換することができます.改めて本問題で検討する二次計画問題は以下のように記述されます:

\begin{align} \min_{x} &\quad \frac{1}{2} x^\top Qx + c^\top x \\ \mathrm{s.t.} &\quad Ax = b, \, x\geqq 0. \end{align}

ここで,$Q$ は $n$ 次正定値対称行列,$c\in\mathbb{R}^{n},\, A\in\mathbb{R}^{m\times n},\, b\in\mathbb{R}^{m}$ は定数ベクトル,定数行列とします.

はじめに,双対問題の導出について簡単に述べておきます.与えられた最適化問題("元問題"と呼ぶことにします,最小化問題とします)の一部の制約条件を緩和して,緩和した制約をペナルティ項として目的関数に組み込んだラグランジュ緩和問題を考えます.すると,ラグランジュ緩和問題の実行可能領域は元問題の実行可能領域よりも広がっており,またペナルティ項が非負であることから,ラグランジュ緩和問題の最適値は元問題の下界を達成することが確認されます.このラグランジュ緩和問題の最適値関数(決定変数はラグランジュ乗数となります)を最大化する問題を考えることによって,元問題の最適値とラグランジュ緩和問題の最適値が一致するようにすることが期待されます.この,ラグランジュ緩和問題の最適値関数を最大化する問題のことをラグランジュ双対問題と呼びます.[双対問題の導出の方法に関する記述おわり]

さて,3.10 の問題に戻りまして,本問題で考える二次計画問題に対するラグランジュ緩和問題を考えてみましょう.まず,制約条件は二つあり,等式制約 $Ax=b$ と決定変数 $x$ に関する非負条件です.等式制約に対するラグランジュ乗数を $u \in \mathbb{R}^{m}$,非負制約に対するラグランジュ乗数を $v\in\mathbb{R}^{n}_{\geqq 0}$ とします.すると,ラグランジュ関数は

\begin{align} L(x, u, v) &:= \frac{1}{2} x^\top Qx + c^\top x + u^\top (Ax-b) - v^\top x \\ &= \frac{1}{2} x^\top Qx + (c + A^\top u - v)^\top x - b^\top u \end{align}

となります.これを $x$ の非負条件の下で最小化する問題(ラグランジュ緩和問題)は次のように定式化されます:

\begin{align} \min_{x} &\quad \frac{1}{2} x^\top Qx + (c + A^\top u - v)^\top x - b^\top u \\ \mathrm{s.t.} &\quad x\in\mathbb{R}^n. \end{align}

いま,行列 $Q$ は正定値対称行列であるから,ラグランジュ緩和問題の目的関数は凸関数であり,その最適解を $\overline{x}$ とすれば,$\overline{x}$ は最適性条件:

\begin{align} \nabla_x L(\overline{x}, u, v) = Q\overline{x} + c + A^\top u - v = 0 \label{3}\tag{3} \end{align}

を満たします.なお,$\frac{1}{2} x^\top Qx$ の $x$ に関する勾配ベクトルが $Qx$ となるのは,$Q$ が対称行列だからです.式 \eqref{3} は $Q$ が正定値行列であるため,

\begin{align} \overline{x} = Q^{-1} (v - c - A^\top u) \end{align}

と表せます.この $\overline{x}$ を用いることによって,ラグランジュ緩和問題の最適値関数は陽に表すことができて,それを最大化する問題は

\begin{align} \max_{u,v} &\quad \frac{1}{2} (v - c - A^\top u)^{\top} Q^{-1} (v - c - A^\top u) - b^\top u \\ \mathrm{s.t.} &\quad v\geqq 0 \end{align}

であり,これが求めるラグランジュ双対問題です.

3.11

遂次二次計画法における Powell の修正 BFGS 公式を用いて近似行列 $B_k$ を更新したとき,$B_k$ が正定値ならば更新後の近似行列 $B_{k+1}$ も正定値となることを示す問題です.

参考