[논문리뷰] Static-Dynamic Co-Teaching for Class-Incremental 3D object detection

2025. 2. 8. 16:40

들어가며

최근 업무를 보면서 학습 데이터가 지속적으로 증가하는 경우가 발생하다보니 Incremental Leanring에 대해서 공부를 하는 경우가 생겼다. 그렇다보니 자연스럽게 2D object detection이외에 다른 분야에도 있을까 생각하고 찾아보다 보니 해당논문을 찾게 되어졌다.

이 논문의 경우 AAAI 2022년 Oral paper로 되어진 논문으로 3D 분야에서 처음으로 적용한 부분이다 보니 더욱 주목 받는 방법이 아닐까 생각이든다.

아래의 그림처럼 Incremental Learning의 기조를 따라가다 보니 Novel Class에 대해서 객체를 찾게 되어지고 기본 Base Classes에서도 여전히 찾게 되어지는것을 볼 수 있다.

그렇다면 이 논문의 핵심 아이디어의 핵심은 새로운 Task에 적용한것 말고 어떤것이 있을까?

저자는 새로운 아디이어로 Pesudo Labeling을 방식을 제안했다. 일반적인 방식이 있을수도 있지만 이전의 Task에서 만들어진 모델을 바탕으로 새로운 Novel에 기존의 Base의 class에 Pesudo labeling을 같이 넣어서 학습을 시키는것이다.

그렇게 되면 Pesudo labeling의 중요성이 높아지는데 이를 해결하기 위해서 Techer Student Model을 들고왔고, Static & Dynamic 이라는 두개의 Teacher를 들고오면서 해당 문제를 해결했다고 한다.

그러면 자세하게 이 논문이 어떤 방식으로 문제를 풀었는지 살펴보자.

방법

Baseline Model

3D에 접근하기 위해서는 저자는 Point Clould Object Detection의 기본이 되어지는 모델일 VoteNet을 수정해서 개선이 되었다고 한다.

VoteNet의 경우 아래의 그림과 같이 있는데 $X$라는 XYZ를 가지는 좌표값을 넣어 Featuer를 추가한 $S$라는 seeds를 뽑아낸다. 이 과정까지는 일반적인 방법이지만 Voting Module이라는 방식을 통해서 Point들을 대표할수 있는 지점을 뽑고 그 주위의 Point들을 구성해서 새롭게 만들어낸다. 이를 통해서 $V$라는 point들이 최정적으로 나오게 되어진다.

이 point들을 바탕으로 Detection이 수행이 되어진다.

SDCOT 모델방식

Pesudo Label Generation

이전에 말했던것처럼 이 논문의 경우 Peusdo label을 만드는것에 아디어를 더했다고 한다.

Novel Class를 학습할때 Base Class로 학습 했던 모델을 Novel Class에 Peusdo labeling을 만들어서 적용했다고 한다.

이 Peusdo labeling을 만드는건 생각보다 너무 쉬운데 Low-confidence box 부분을 지웠고 그리고 Classification 의 확률값과 바탕으로 낮은 Prob을 가진 Class도 Pesudo labeing이 넣지 않는 방식을 선택했다.

그럼에도 불구하고 부정확한 결과가 나온다는데 이를 해결하기 위해서 아래의 새로운 방법을 사용한다.

Static-Dynamic Co-Teaching

저자는 부정확한 결과를 개선하기 위해서 Static Teacher과 Dynamic Teacher를 2개를 만들어서 작업을 하는데 각각의 Teacher의 하는 역할은 다음과 같이 나뉘어진다.

Static Teacher의 경우는 Base Class로 학습한후 Freeze되어진 모델이며 이 Teacher의 역할은 Peusdo labeling을 만들어 내는 역할을 하며 Distillation을 Student에 하는 역할로 보면되어진다.

Dynmaic Teacher의 경우는 기존의 Student에 대해서 EMA가 진행이 되어짐과 동시게 Input에 대해서 Consistency를 유지하기 위한 역할을 수행한다.

전체적인 흐름은 아래의 그림과 같이 되어진다.

그러면 각각의 Loss는 아래와 같이 되어진다.

Distillation Loss의 경우는 Student와 Static Teacher의 SoftMax이전의 Logit의 값의 차이를 최소화하는 작업을 말한다. 그럴경우 이전의 Knwoledge를 Distiliation하는 효과가 있다.

Supervised Loss의 경우는 기존의 CE로 적용이 되어지면 Novel Class를 추가해서 BaseL Class와 함께 재 학습을 하는데 이때 Base Class의 경우는 Static Teacher에서 나온 Pesudo label로 적용이 되어서 학습이 되어진다.

Consistency Loss의 경우에서는 SimCLR와 같은 Loss를 사용한다고 보면된다.

방법은 너무 단순하지만 효과적으로 나오며 기존에 접근하지 않았던 새로운 방법이라 확실히 성능적인 면은 효과가 있다.

[매일 코딩 공부] 연구소(14502),

2024. 4. 5. 01:34

https://www.acmicpc.net/problem/14502

문제

14502번: 연구소

인체에 치명적인 바이러스를 연구하던 연구소에서 바이러스가 유출되었다. 다행히 바이러스는 아직 퍼지지 않았고, 바이러스의 확산을 막기 위해서 연구소에 벽을 세우려고 한다. 연구소는 크

www.acmicpc.net

인체에 치명적인 바이러스를 연구하던 연구소에서 바이러스가 유출되었다. 다행히 바이러스는 아직 퍼지지 않았고, 바이러스의 확산을 막기 위해서 연구소에 벽을 세우려고 한다.

연구소는 크기가 N×M인 직사각형으로 나타낼 수 있으며, 직사각형은 1×1 크기의 정사각형으로 나누어져 있다. 연구소는 빈 칸, 벽으로 이루어져 있으며, 벽은 칸 하나를 가득 차지한다.

일부 칸은 바이러스가 존재하며, 이 바이러스는 상하좌우로 인접한 빈 칸으로 모두 퍼져나갈 수 있다. 새로 세울 수 있는 벽의 개수는 3개이며, 꼭 3개를 세워야 한다.

예를 들어, 아래와 같이 연구소가 생긴 경우를 살펴보자.

2 0 0 0 1 1 0
0 0 1 0 1 2 0
0 1 1 0 1 0 0
0 1 0 0 0 0 0
0 0 0 0 0 1 1
0 1 0 0 0 0 0
0 1 0 0 0 0 0

이때, 0은 빈 칸, 1은 벽, 2는 바이러스가 있는 곳이다. 아무런 벽을 세우지 않는다면, 바이러스는 모든 빈 칸으로 퍼져나갈 수 있다.

2행 1열, 1행 2열, 4행 6열에 벽을 세운다면 지도의 모양은 아래와 같아지게 된다.

2 1 0 0 1 1 0
1 0 1 0 1 2 0
0 1 1 0 1 0 0
0 1 0 0 0 1 0
0 0 0 0 0 1 1
0 1 0 0 0 0 0
0 1 0 0 0 0 0

바이러스가 퍼진 뒤의 모습은 아래와 같아진다.

2 1 0 0 1 1 2
1 0 1 0 1 2 2
0 1 1 0 1 2 2
0 1 0 0 0 1 2
0 0 0 0 0 1 1
0 1 0 0 0 0 0
0 1 0 0 0 0 0

벽을 3개 세운 뒤, 바이러스가 퍼질 수 없는 곳을 안전 영역이라고 한다. 위의 지도에서 안전 영역의 크기는 27이다.

연구소의 지도가 주어졌을 때 얻을 수 있는 안전 영역 크기의 최댓값을 구하는 프로그램을 작성하시오.

입력

첫째 줄에 지도의 세로 크기 N과 가로 크기 M이 주어진다. (3 ≤ N, M ≤ 8)

둘째 줄부터 N개의 줄에 지도의 모양이 주어진다. 0은 빈 칸, 1은 벽, 2는 바이러스가 있는 위치이다. 2의 개수는 2보다 크거나 같고, 10보다 작거나 같은 자연수이다.

빈 칸의 개수는 3개 이상이다.

출력

첫째 줄에 얻을 수 있는 안전 영역의 최대 크기를 출력한다.

예제 입력 1

7 7
2 0 0 0 1 1 0
0 0 1 0 1 2 0
0 1 1 0 1 0 0
0 1 0 0 0 0 0
0 0 0 0 0 1 1
0 1 0 0 0 0 0
0 1 0 0 0 0 0

예제 출력 1

예제 입력 2

4 6
0 0 0 0 0 0
1 0 0 0 0 2
1 1 1 0 0 2
0 0 0 0 0 2

예제 출력 2

Solution

1. 이 문제의 경우에서는 완전탐색으로 풀어야 된다. 그렇다면 BFS/DFS둘중에 하나이다.

2. 바이러스의 대한 정보를 저장해놓는것이 중요함.

3. 4방향으로 바이러스는 퍼짐

4. 백트레킹으로 시간단축을 해야됨

5. 하지만 combination으로 변경해서 풀면 시간 내에 풀림

import sys
import copy
from collections import deque
from itertools import combinations
input = sys.stdin.readline
N,M = list(map(int,input().split()))

# 바이러스 위치 추출
maps = []
birus_list = []
y_x_list = []
for yidx in range(N): 
    row = list(map(int,input().split()))
    maps.append(row)
    for xidx, j in enumerate(row): 
        if j == 2 : 
            birus_list.append([yidx, xidx])
        if j == 0 : 
            y_x_list.append([yidx,xidx])

moves = [[-1,0],[1,0],[0,-1],[0,1]] # moving
answer = 0 
def move_avaiable(y,x,tmp_maps): 
    return 0<=y<N and 0<=x<M and tmp_maps[y][x] == 0

def cal_area(tmp_maps): 
    return sum([row.count(0) for row in tmp_maps])

def bfs(): 
    global answer
    q = deque(birus_list)
    tmp_maps = copy.deepcopy(maps)

    while q: 
        y, x = q.popleft()
        for dy, dx in moves: 
            ny, nx = dy + y, dx + x
            if move_avaiable(ny, nx, tmp_maps): #이동가능하면 퍼진다.
                tmp_maps[ny][nx] = 2 # 새롭게
                q.append([ny,nx])
    count = cal_area(tmp_maps)
    answer = max(answer, count)
    return 
# map의 기준으로 벽생성
# def make_wall(cnt): 
#     if cnt == 3: 
#         bfs()
#         return 
#     for j in range(N): 
#         for i in range(M): 
#             if maps[j][i] == 0 : 
#                 maps[j][i] = 1
#                 make_wall(cnt+1)
#                 maps[j][i] = 0 # backtrking

def make_wall(cnt): 
    for c in combinations(y_x_list,3): 
        for cy, cx in c:  maps[cy][cx] = 1
        bfs()
        for cy, cx in c:  maps[cy][cx] = 0

make_wall(0)
print(answer)

https://www.acmicpc.net/problem/14500

14500번: 테트로미노

폴리오미노란 크기가 1×1인 정사각형을 여러 개 이어서 붙인 도형이며, 다음과 같은 조건을 만족해야 한다. 정사각형은 서로 겹치면 안 된다. 도형은 모두 연결되어 있어야 한다. 정사각형의 변

www.acmicpc.net

문제

폴리오미노란 크기가 1×1인 정사각형을 여러 개 이어서 붙인 도형이며, 다음과 같은 조건을 만족해야 한다.

정사각형은 서로 겹치면 안 된다.
도형은 모두 연결되어 있어야 한다.
정사각형의 변끼리 연결되어 있어야 한다. 즉, 꼭짓점과 꼭짓점만 맞닿아 있으면 안 된다.

정사각형 4개를 이어 붙인 폴리오미노는 테트로미노라고 하며, 다음과 같은 5가지가 있다.

아름이는 크기가 N×M인 종이 위에 테트로미노 하나를 놓으려고 한다. 종이는 1×1 크기의 칸으로 나누어져 있으며, 각각의 칸에는 정수가 하나 쓰여 있다.

테트로미노 하나를 적절히 놓아서 테트로미노가 놓인 칸에 쓰여 있는 수들의 합을 최대로 하는 프로그램을 작성하시오.

테트로미노는 반드시 한 정사각형이 정확히 하나의 칸을 포함하도록 놓아야 하며, 회전이나 대칭을 시켜도 된다.

입력

첫째 줄에 종이의 세로 크기 N과 가로 크기 M이 주어진다. (4 ≤ N, M ≤ 500)

둘째 줄부터 N개의 줄에 종이에 쓰여 있는 수가 주어진다. i번째 줄의 j번째 수는 위에서부터 i번째 칸, 왼쪽에서부터 j번째 칸에 쓰여 있는 수이다. 입력으로 주어지는 수는 1,000을 넘지 않는 자연수이다.

출력

첫째 줄에 테트로미노가 놓인 칸에 쓰인 수들의 합의 최댓값을 출력한다.

예제 입력 1 복사

예제 출력 1 복사

예제 입력 2 복사

예제 출력 2 복사

예제 입력 3 복사

4 10
1 2 1 2 1 2 1 2 1 2
2 1 2 1 2 1 2 1 2 1
1 2 1 2 1 2 1 2 1 2
2 1 2 1 2 1 2 1 2 1

예제 출력 3 복사

[매일 코딩 공부] 백준 뱀(3190), 주사위 굴리기(14499)

2024. 3. 26. 16:15

https://www.acmicpc.net/problem/3190

3190번: 뱀

'Dummy' 라는 도스게임이 있다. 이 게임에는 뱀이 나와서 기어다니는데, 사과를 먹으면 뱀 길이가 늘어난다. 뱀이 이리저리 기어다니다가 벽 또는 자기자신의 몸과 부딪히면 게임이 끝난다. 게임

www.acmicpc.net

뱀 성공다국어

한국어

시간 제한메모리 제한제출정답맞힌 사람정답 비율

1 초

128 MB

74026

31468

21120

40.883%

문제

'Dummy' 라는 도스게임이 있다. 이 게임에는 뱀이 나와서 기어다니는데, 사과를 먹으면 뱀 길이가 늘어난다. 뱀이 이리저리 기어다니다가 벽 또는 자기자신의 몸과 부딪히면 게임이 끝난다.

게임은 NxN 정사각 보드위에서 진행되고, 몇몇 칸에는 사과가 놓여져 있다. 보드의 상하좌우 끝에 벽이 있다. 게임이 시작할때 뱀은 맨위 맨좌측에 위치하고 뱀의 길이는 1 이다. 뱀은 처음에 오른쪽을 향한다.

뱀은 매 초마다 이동을 하는데 다음과 같은 규칙을 따른다.

먼저 뱀은 몸길이를 늘려 머리를 다음칸에 위치시킨다.
만약 벽이나 자기자신의 몸과 부딪히면 게임이 끝난다.
만약 이동한 칸에 사과가 있다면, 그 칸에 있던 사과가 없어지고 꼬리는 움직이지 않는다.
만약 이동한 칸에 사과가 없다면, 몸길이를 줄여서 꼬리가 위치한 칸을 비워준다. 즉, 몸길이는 변하지 않는다.

사과의 위치와 뱀의 이동경로가 주어질 때 이 게임이 몇 초에 끝나는지 계산하라.

입력

첫째 줄에 보드의 크기 N이 주어진다. (2 ≤ N ≤ 100) 다음 줄에 사과의 개수 K가 주어진다. (0 ≤ K ≤ 100)

다음 K개의 줄에는 사과의 위치가 주어지는데, 첫 번째 정수는 행, 두 번째 정수는 열 위치를 의미한다. 사과의 위치는 모두 다르며, 맨 위 맨 좌측 (1행 1열) 에는 사과가 없다.

다음 줄에는 뱀의 방향 변환 횟수 L 이 주어진다. (1 ≤ L ≤ 100)

다음 L개의 줄에는 뱀의 방향 변환 정보가 주어지는데, 정수 X와 문자 C로 이루어져 있으며. 게임 시작 시간으로부터 X초가 끝난 뒤에 왼쪽(C가 'L') 또는 오른쪽(C가 'D')로 90도 방향을 회전시킨다는 뜻이다. X는 10,000 이하의 양의 정수이며, 방향 전환 정보는 X가 증가하는 순으로 주어진다.

출력

첫째 줄에 게임이 몇 초에 끝나는지 출력한다.

예제 입력 1 복사

예제 출력 1 복사

예제 입력 2 복사

예제 출력 2 복사

예제 입력 3 복사

예제 출력 3 복사

문제방법

1. 문제대로 차근차근이 읽으면서 경우의 수를 생각해서 예외처리해주면됨

2. 큐의 형태로 생각하면서 문제를 풀자.

from collections import deque
import sys
inputs = sys.stdin.readline
N = int(inputs())
maps = [[0]*N for _ in range(N)]

K = int(inputs())
apple_index = [list(map(int,inputs().split())) for _ in range(K)]
for y,x in apple_index:
    maps[y-1][x-1] = -1 # 사과 있음 

D = int(inputs())
directions = {}
for i in range(D):
    x, c = input().split()
    directions[int(x)] = c

move = [[0,1],[1,0],[0,-1],[-1,0]] #오하왼상 
## 몇초안에 끝나는지.. 계속 길이가 길어지고 있음 & 큐로 푸는것임.. 구현문제도 맞는듯.. 

def rotate_direction(curr_dir, move_idx): 
    if curr_dir == 'L': 
        move_idx -= 1
    elif curr_dir == 'D': 
        move_idx += 1
    return move_idx%4

# 너무 어렵게 생각하지말자.뱀의 길이가 이전의 길이에 따라오면 되는 것이 핵심 아이디어도 
y, x, curr_dir = 0,0,0
start_time = 0 

q = deque()
q.append((y,x))
while True : 
    start_time += 1 
    dy, dx = move[curr_dir] # 초기 방향설정
    ny, nx = y + dy, x + dx # 다음길이로 이동
    if ny < 0 or ny >= N or nx < 0 or nx >= N or (ny,nx) in q:  # 벽에 부딧치거나 꼬리에 부딧치면 게임 끝
        break
    # 사과를 먹지 못한다면 꼬리가 따라다님
    if maps[ny][nx] != -1:
        ty,tx = q.popleft()
        maps[ty][tx]=0
    
    # 지나갈때마다 경로를 체크
    y, x = ny, nx
    maps[ny][nx] = 1
    q.append((ny, nx))
	
    # 시간에 해당하는 방향전환 정보가 있을 경우
    if start_time in directions.keys():
        curr_dir = rotate_direction(directions[start_time], curr_dir)
print(start_time)

https://www.acmicpc.net/problem/14499

14499번: 주사위 굴리기

첫째 줄에 지도의 세로 크기 N, 가로 크기 M (1 ≤ N, M ≤ 20), 주사위를 놓은 곳의 좌표 x, y(0 ≤ x ≤ N-1, 0 ≤ y ≤ M-1), 그리고 명령의 개수 K (1 ≤ K ≤ 1,000)가 주어진다. 둘째 줄부터 N개의 줄에 지

www.acmicpc.net

주사위 굴리기 성공

시간 제한메모리 제한제출정답맞힌 사람정답 비율

2 초

512 MB

50209

22912

16651

44.991%

문제

크기가 N×M인 지도가 존재한다. 지도의 오른쪽은 동쪽, 위쪽은 북쪽이다. 이 지도의 위에 주사위가 하나 놓여져 있으며, 주사위의 전개도는 아래와 같다. 지도의 좌표는 (r, c)로 나타내며, r는 북쪽으로부터 떨어진 칸의 개수, c는 서쪽으로부터 떨어진 칸의 개수이다.

주사위는 지도 위에 윗 면이 1이고, 동쪽을 바라보는 방향이 3인 상태로 놓여져 있으며, 놓여져 있는 곳의 좌표는 (x, y) 이다. 가장 처음에 주사위에는 모든 면에 0이 적혀져 있다.

지도의 각 칸에는 정수가 하나씩 쓰여져 있다. 주사위를 굴렸을 때, 이동한 칸에 쓰여 있는 수가 0이면, 주사위의 바닥면에 쓰여 있는 수가 칸에 복사된다. 0이 아닌 경우에는 칸에 쓰여 있는 수가 주사위의 바닥면으로 복사되며, 칸에 쓰여 있는 수는 0이 된다.

주사위를 놓은 곳의 좌표와 이동시키는 명령이 주어졌을 때, 주사위가 이동했을 때 마다 상단에 쓰여 있는 값을 구하는 프로그램을 작성하시오.

주사위는 지도의 바깥으로 이동시킬 수 없다. 만약 바깥으로 이동시키려고 하는 경우에는 해당 명령을 무시해야 하며, 출력도 하면 안 된다.

입력

첫째 줄에 지도의 세로 크기 N, 가로 크기 M (1 ≤ N, M ≤ 20), 주사위를 놓은 곳의 좌표 x, y(0 ≤ x ≤ N-1, 0 ≤ y ≤ M-1), 그리고 명령의 개수 K (1 ≤ K ≤ 1,000)가 주어진다.

둘째 줄부터 N개의 줄에 지도에 쓰여 있는 수가 북쪽부터 남쪽으로, 각 줄은 서쪽부터 동쪽 순서대로 주어진다. 주사위를 놓은 칸에 쓰여 있는 수는 항상 0이다. 지도의 각 칸에 쓰여 있는 수는 10 미만의 자연수 또는 0이다.

마지막 줄에는 이동하는 명령이 순서대로 주어진다. 동쪽은 1, 서쪽은 2, 북쪽은 3, 남쪽은 4로 주어진다.

출력

이동할 때마다 주사위의 윗 면에 쓰여 있는 수를 출력한다. 만약 바깥으로 이동시키려고 하는 경우에는 해당 명령을 무시해야 하며, 출력도 하면 안 된다.

예제 입력 1 복사

4 2 0 0 8
0 2
3 4
5 6
7 8
4 4 4 1 3 3 3 2

예제 출력 1 복사

예제 입력 2 복사

3 3 1 1 9
1 2 3
4 0 5
6 7 8
1 3 2 2 4 4 1 1 3

예제 출력 2 복사

문제풀이

1. 구현문제이기때문에 3차원에서 주사위가 굴러갈때 변경되는 값을 저장해놓으면 쉽다.

2. 그외에 시작점이나 변수선언에 유의해서 작성하자

import sys
inputs = sys.stdin.readline
N,M,y,x,K = list(map(int, inputs().split()))
maps = [list(map(int, inputs().split())) for i in range(N)]
direction = list(map(int, inputs().split()))

dice = [0,0,0,0,0,0]
move = [[0,1],[0,-1],[-1,0],[1,0]] #동서북남
sy,sx = y,x

def flip(dice, direct): 
    a,b,c,d,e,f = dice
    if direct == 1: #동    
        dice = d,b,a,f,e,c
    elif direct == 2: #서 
        dice = c,b,f,a,e,d
    elif direct == 3 : #북 
        dice = e,a,c,d,f,b
    elif direct == 4: #남
        dice = b,f,c,d,a,e
    return list(dice)

#주사위 문제로써 구현문제라고 볼 수 있다.
answer = []
for direct in direction: 
    dy,dx = move[direct-1]
    ny, nx = sy+dy, sx+dx
    if 0<=ny<N and 0<=nx<M: #범위안에서만 동작한다. 주사위가 돌아갔으며 위치도 위치도 이동함
        sy, sx = ny, nx
        
        dice = flip(dice, direct)
        
        if maps[ny][nx] == 0 : # 바닥면이 0이면 주사위의 값이 복사가 되어진다. 
            maps[ny][nx] = dice[-1]

        else: # 아닐경우 바닥면에 주사위의 밑으로 복사가 되어짐
            dice[-1] = maps[ny][nx] 
            maps[ny][nx] = 0 # 바닥은 0으로 변경됨 
        print(dice[0])

PREV 1 2 3 4 ···33 NEXT

찰진판다

[논문리뷰] Static-Dynamic Co-Teaching for Class-Incremental 3D object detection

들어가며

방법

Baseline Model

SDCOT 모델방식

Pesudo Label Generation

Static-Dynamic Co-Teaching

[매일 코딩 공부] 연구소(14502),

https://www.acmicpc.net/problem/14502

문제

입력

출력

예제 입력 1

예제 출력 1

예제 입력 2

예제 출력 2

Solution

문제

입력

출력

예제 입력 1 복사

예제 출력 1 복사

예제 입력 2 복사

예제 출력 2 복사

예제 입력 3 복사

예제 출력 3 복사

[매일 코딩 공부] 백준 뱀(3190), 주사위 굴리기(14499)

뱀 성공다국어

문제

입력

출력

예제 입력 1 복사

예제 출력 1 복사

예제 입력 2 복사

예제 출력 2 복사

예제 입력 3 복사

예제 출력 3 복사

문제방법

주사위 굴리기 성공

문제

입력

출력

예제 입력 1 복사

예제 출력 1 복사

예제 입력 2 복사

예제 출력 2 복사

문제풀이

+ Recent posts

티스토리툴바