본문 바로가기

IT 지식

[1일 1로그 100일 완성 IT 지식] 자유로운 소프트웨어, 오픈 소스

해당 글 <자유로운 소프트웨어, 오픈 소스>에서 요약된 목차

  

2부 - 소프트웨어  

    031. 자유로운 소프트웨어, 오픈 소스 

 

소스란 무엇인가?

 

  '소스 코드'는 프로그래머가 작성하는 코드를 말한다. 소스 코드는 사람이 읽을 수 있고 사업체의 독자적인 아이디어나 기법을 포함하고 있기 때문에 정보 유출 위험이 있어 오픈되지 않았다. 

 

1983년 MIT에서 일하던 프로그래머 리처드 스톨만은 소스 코드에 접근할 수 없어 프로그램을 연구하거나 개선할 수 없다는 점에 불만을 가지게 된다. 그래서 시작한 게 GNU(GNU's Not Unix) 프로젝트다. 주요 목적은 운영체제와 프로그래밍 언어용 컴파일러와 같은 중요한 소프트웨어 시스템을 소스 코드 사용에 대한 제약 없이 배포하는 것이며, GNU GPL(General Public License)이라는 저작권 라이선스에 따라 소스 코드 공개가 강제되고 있다.  

 

오픈 소스의 영향력 

 

제일 유명한 오픈 소스 프로젝트는 리눅스 운영체제다. 리눅스는 누구든 소스를 읽고 수정할 수 있으며, 수정한 코드가 받아들여질 경우 제안한 사람은 기여자가 되어 개발진으로 이름이 올려진다. 구글이 인프라 전체를 리눅스 상에서 운영하고 있을 만큼 대규모 영리 기업에서 널리 활용되고 있다. 

 

프로그래밍 언어와 소프트웨어 개발 툴은 이제 거의 오픈 소스로 만들어진다. 책 본문에서 "독점 방식만 있다면 새로운 프로그래밍 언어의 확립[각주:1]이 어려울 것"이라고 말했는데, 한두 사람이 만든 프로그래밍 언어가 세계적으로 쓰이고 있는 사례도 있으니 이 부분은 생각해 볼 필요가 있다. 


Read me seconds.

 

오픈 소스 AI

 

  최근 로이터 보도에 따르면 유럽연합의 AI 규제 법안이 합의되었다고 알려졌다. "법안은 인공지능의 위험을 그 정도에 따라 i) 허용될 수 없는 위험(an unacceptable risk), ii) 고위험(a high risk), iii) 저위험 또는 최소한의 위험(low or minimal risk)으로 구분하여 차등적으로 규제하며, 허용될 수 없는 위험을 가진 인공지능은 엄격히 금지하고, 고위험 인공지능에 대해서는 엄격한 요구사항을 부과한다." (참고 자료 1) 텍스트나 이미지를 생성하는 AI의 경우 고위험 인공지능으로 학습 데이터를 모두 공개해야 한다. 한편, 오픈 소스 AI는 위험성이 높다고 판단되지 않는 한 규제가 적용되지 않을 것이라고 밝혀졌다. 이 내용은 오픈 소스 AI 개발을 활발히 하는 결과를 가져올 것으로 예상된다. 

 

오픈 소스는 여러 사람의 참여를 통해 집단 지성이 발휘될 수 있다는 장점이 있다. 마크 저커버그는 오픈 소스LLM(Large Language Model)라마2[각주:2]를 발표하면서 "오픈 소스는 더 많은 개발자가 새로운 기술을 쓸 수 있도록 해줌으로써 혁신을 촉진한다. 소프트웨어가 공개되면 더 많은 사람이 검토해 잠재적인 문제를 파악하고 고칠 수 있기 때문에 안정성과 보안성도 향상된다."고 말했다. (참고 자료 2)

 

그러나 여러 사람의 참여는 소프트웨어를 악의적으로 사용하는 결과를 초래할 수도 있다. 그럼 오픈 소스를 사용하는 게 맞을까?

 

지금 당장 맞다, 아니다를 확언할 수 없지만 유럽연합이 폐쇄형 모델에 비해 오픈 소스 AI 모델 규제를 상대적으로 완화한 이유가 뭔지 추측하며 오픈 소스 존재 의의를 그려볼 수 있다. 사람들은 오픈 소스의 투명성이 AI의 배드엔딩을 저지할 가능성이 있다고 판단했던 것이다. AI의 배드엔딩이란 소수의 기업이 기술을 독점하고 산업 전체를 좌지우지하는 것이다. 

 

뉴스 기사에 따르면 "지난 5일 메타와 IBM은 오픈 소스 AI 모델을 추진하는 AI 기업과 연구기관 등 50개 단체와 AI 얼라이언스를 출범했다."(참고 자료 3) 소수의 기업이 AI의 미래를 결정하는 것을 막고 혁신과 안전을 도모하는 것이 목적이다. 오픈AI 라이벌로 주목 받고 있는 미스트랄 AI[각주:3]도 개방형 소프트웨어와 커뮤니티를 지향한다는 점에서 AI 산업에서의 오픈 소스 존재감은 점점 더 커져가고 있다.


참고 자료

  1. 박교선, 김우균, 윤주탁, 신다윤, 최자림, "유럽연합 인공지능법안",「법무법인(유)세종 뉴스레터」, 2023.10.17. 
  2. 안경애, "AI 민주화, 약인가 독인가..오픈소스 AI 뜨거운 논쟁", 「디지털타임스」, 2023.09.17.
  3. 박찬, "메타·IBM 등 50개 단체, 오픈 소스 AI 연합 출범..."소수 기업에 AI 미래 맡길 수 없어", 「AI타임스」, 2023.12.06.
  4. 황순민, "AI 한발늦은 유럽…소형모델로 틈새 노린다", 「매일경제」, 2023.12.12.

용어 설명

  1. 확립 : 생각이나 체계가 굳고 확실하게 섬 [본문으로]
  2. 라마2 : 라마2는 훈련 데이터나 훈련에 사용된 코드는 공유하지 않아서 반쪽짜리 오픈 소스라는 지적이 있다. [본문으로]
  3. 미스트랄 AI : 프랑스 AI 스타트업 기업으로 소형대규모언어모델(sLLM)과 오픈소스가 비즈니스의 키워드다. sLLM은 특정 영역에서 높은 수준의 생성 작업을 수행할 수 있고 활용성이 높다. (참고 자료 4) [본문으로]