Convex Optimization - Lecture 3

 

Create time: Feb 06, 2020 11:47 PM Update time: Feb 09, 2020 11:05 PM

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled.png

Definition of Convex function

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%201.png

domain이 convex set 이여야 한다.

그리고 convex function 에서 두 점을 뽑아서 line segment 를 구성했을때, function 의 값은 해당 line segment 보다 작거나 같아야한다. 즉, 볼록함수여야함.

무조건 bolw shape 일 필요는 없지만 positive curvature이여야 한다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%202.png

위 식에서 equality를 제거하면, strictly convex functinon이 된다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%203.png

Example on R

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%204.png

affine function은 위 수식에서 line segment == funciton 인 상태이다. 직선

사실 R 공간 안에서는 함수를 2차원적으로 그릴 수 있다. 그래서 강의에서는 그저 함수를 그려보고, 커브가 어떻게 형성되는지 보는것으로도 어느정도 convex function인지 알 수 있을것이라 한다.

Examples on R^n and R^{m×n}

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%205.png

vector 공간에서 affine function은 convex 하다. 또한 p≥1 인 모든 norm 또한 convex 하다. 이는 2강에서 배웠던 내용. matrix 공간에서도 convex 하다.

tr 는 선형대수학에서 matrix의 대각합을 뜻함. 행렬의 곱에 대각합을 적용하면 다음과같이 연산된다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%206.png

Restriction of a convex function to a line

해당 내용에 대해 좋은 QnA가 있어서 가져옴.

What does it mean to restricting a function to a line in convex optimization?

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%207.png

특정 함수가 하나 있다고 해보자.

domain 에서 하나의 점을 찍고, 그 점에서 하나의 방향으로 쭉 선을 그었다고 생각해보자. 함수의 단면? 이라고 생각하면 될듯하다.

그 단면이 convex 한가? 를 측정하는것이다.

여기서 domain에 있는 모든 x 에 대하여, 어떤 방향 v 으로 이 동작을 하던간에, 항상 그 단면이 convex 하다면, 그 함수는 convex funciton 이다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%208.png

Extended-value extension

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%209.png

특정 convex function을 모든 실수 공간으로 확장하려한다. 그럴땐 간단하게 기존 함수의 domain이 아닌 영역을 +무한 으로 잡으면 된다. 아래 그럼처럼.

concave function은 반대로 하면 된다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2010.png

First-order condition

함수 f 가 미분 가능하고, convex function 이라면, 특정 점 x 에서 생성한 1차 테일러 다항식 그래프, R^2 에서 생각해보면 접선은, 항상 그 convex function 보다 작은 함수 이다. global underestimator 이다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2011.png

Second-order conditions

함수 f 가 두번 미분 가능할때, matrix에서는 hassian matrix가 존재할때, domain 이 convex 한 함수 f 의 2차 미분이 0 보다 클 경우, 함수 f 는 convex function 이고 그 역도 성립한다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2012.png

matrix 입장에서는, domain이 convex set 이고, hassian matrix 가 존재하고, hassian matrix 가 positive semi-definite matrix 인 경우, 함수 f 는 convex function 이다.

또한, positive definite matrix 인 경우, strictly convex 이다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2013.png

Epigraph and sublevel set

함수 f 가 convex function 일 경우, epigraph 는 convex set 이다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2014.png

위 그림은 non-convex function 이므로, epigraph 는 convex set이 아니다. 역도 성립.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2015.png

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2016.png

convex funciton 의 sublevel set 또한 convex set 이다. convexity 의 definition을 적용해보면 바로 알 수 있다.

Jensen’s inequality

함수 f 가 convex 이면, f(x) 와 f(y) 의 평균, 또는 line segment 중 하나의 값은, 그에 대응하는 f(x + y) 보다 항상 크거나 같다. 아래 그림을 보면 이해가 될듯.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2017.png

또한, 아래 부등식도 만족한다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2018.png

Operations that preserve convexity

convex funciton의 convexity를 유지하기 위한 연산을 살펴보자.

Positive weighted sum & composition with affine function

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2019.png

  • convex function에 non-negative 상수를 곱해도 convex function 이다.
  • 두 convex function을 합하여도 convex function 이다.
  • domain 에 affine function을 적용해도, convex function 이다.

Pointwise maximum

두 convex function max 만 뽑은 function 또한 convex function 이다.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2020.png

두 convex function의 교집합 이라고 생각됨.

Pointwise supremum

??? supremum에 대한 이해가 없어서 추후 추가 예정…

Composition with scalar functions

g: Rn → R1 인 함수와 h: R → R 인 함수 를 합성해보자.

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2021.png

다음과 같은 경우 f 가 convex funciton 이다.

  • g 가 convex, h 가 convex, h 의 extended-value extention 이 non-descreasing
  • g 가 concave, h 가 convex, h 의 extended-value extention 이 non-increasing

예시)

https://strutive07.github.io/assets/images/Lecture_3_logistics/Untitled%2022.png