파이썬 코드로 쉽게 배우는 머신러닝 시리즈 (1) 선형 회귀분석(Linear Regression) 대학원 시절, 패턴인식 과제로 수행했었던 혹은 과제 수행을 위한 선행 지식을 위해 혼자 공부했던 머신러닝, 딥러닝 관련 코드를 정리해서 올려보려 한다. 첫 시작은 선형 회귀분석이다. 참고로 본 포스팅에서는 수학적 지식은 최소한으로 다루고, 파이썬 sklearn을 사용한 선형 회귀분석의 '코드 구현과 활용'의 측면에 초점을 맞추었다. 선형회귀(Linear Regression) 모델이란? 선형회귀 모델은 지도학습 중 예측 문제에 사용하는 모델이다. 예측 문제란 기존 데이터를 기반으로 생성된 모델을 이용하여 새로운 데이터가 들어왔을 때 어떤 값이 될지 예측하는 문제를 말한다. 주식예측을 간단한 예로 들 수 있겠다..
얼마전 대학생 '이동훈'씨가 만든 코로나맵에 이어 '코로나 알리미'가 나왔다. 코로나 알리미는 코로나맵과 비교해 어떤 기능에서 차이가 있는지, 어떤 기능을 제공하는지, 사용법이 어떻게 되는지 자세한 사용법과 사용 후기를 작성해보려 한다. 국내 코로나 알리미 등장 코로나 확진자의 이동 경로와 여러 감염 현황을 한눈에 알 수 있었던 코로나맵도 대학생이 개발하고 서비스해서 화제가 되었는데 대학생이 개발한 또 하나의 신종코로나 서비스가 나왔다. 바로 '코로나 알리미'이다. 코로나 알리미는 이동 경로를 한눈에 볼 수 있다는 장점을 가진 코로나맵과 비교해 내 주변, 내가 가려고 하는 목적지의 주변에 코로나 확진자가 다녀간 장소가 있는지를 확인할 수 있는 기능이 두드러진다. 코로나 알리미, 누가? 왜? 코로나 알리미..
우분투에 ssh-server 을 설치하고 XShell이라는 원격 접속 프로그램을 사용해 원격 접속을 하는 과정을 정리한다. 굳이 서버를 설치하고 원격 프로그램으로 접속하는 이유는, XShell 이 엄청나게 편한 프로그램이기 때문이다. 사실 ssh-server 설치 과정은 매우 간단하고 XShell 프로그램 추천이 목적이다ㅎㅎ 패키지 업데이트 처음 리눅스를 설치한 경우에 패키지 업데이트가 필요한 경우가 많다. 그러니 먼저 패키지 업데이트하는 것을 추천한다. sudo apt-get update 위 명령이 부담스럽다면, (전체 패키지를 업데이트하는 것이기 때문에) 필요한 패키지만 골라서 설치할 수도 있다. apt-get install --only-upgrade openssh-server 우분투에 ssh 서버 ..
저번 포스팅에서 포트스캐닝을 탐지해보았는데 이번엔 DDoS 공격 유형 중 하나로 TCP SYN Flooding을 선택해 snort 룰을 생성하여 탐지해본다. TCP SYN Flooding (DDoS) 공격이란 TCP SYN Flodding은 DDoS 공격 중 하나로 대량의 SYN 패킷을 타깃 서버로 보내, 서버의 대기큐를 가득 채워 정상 클라이언트의 연결 요청을 방해하는 공격이다. 원래 서버는 SYN을 받으면 SYN_ACK를 보내주고 해당 정보를 incomplete 큐에 저장한다. 그리고 클라이언트에게서 ACK를 다시 받게되면, 연결이 완료되었으니 incomplete 큐에 있던 정보를 complete 큐에 보낸다. 그리고 이 2개의 큐를 합쳐서 TCP 대기큐라고 한다. 그런데 공격자가 대량의 SYN만 보..
얼마전엔 네이처리퍼블릭 개인정보 유출이 있었는데, 이번엔 방탄소년단 팬 커뮤니티 앱인 위버스의 개인정보가 유출됐는 소식이다. 어떻게 유출됐는지 경위와 빅히트엔터테인먼트의 입장, 유출된 항목 등에 대해 살펴본다. 위버스(Weverse)란? 위버스는 빅히트엔터테인먼트의 자회사 비엔덱스가 제체 제작하고 운영중인 빅히트엔터테인먼트 소속 아티스트들의 팬 커뮤니트 앱이다. 방탄소년단(BTS), 투모로우바이투게더(TXT), 여자친구가 속해있다. 방탄소년단(BTS) 팬 커뮤니티 위버스 개인정보 유출사건 개요 방탄소년단(BTS), 투모로우바이투게더(TXT), 여자친구 팬 커뮤니티 앱인 위버스(Weverse) 일부 회원들의 개인정보가 유출됐다. 일부 회원들 각자가 위버스 측으로부터 사과문을 받은 듯 해보이는데 공지사항에 ..
규제샌드박스는 이미 시행한지 1년이 지났는데 아직도 화제다. 올해 5월부터는 규제샌드박스 통과에 따라 모바일 운전면허증도 출시된다. 규제샌드박스란 무엇이고 주요 내용과, 신청하기 위한 조건, 방법, 실증사례 그리고 문제점 등에 대해 알아본다. 규제샌드박스란 기업이 창의적, 혁신적 서비스나 제품을 출시하려 할 때 보통 기존 규제에 의해 출시가 미뤄지거나 무산되어 새로운 변화를 모색하려는 기업의 의지나 기회가 막히는 경우가 많았다(특히나 정보통신 ICT 기술 관련 기업 등 신기술을 사용하는 산업). 대표적으로 휴이노의 '심전도 측정 스마트워치'를 예로 들 수 있는데 이는 애플워치4가 심전도 측정 기능을 탑재하기 4년전에 개발되었으나 여러 규제에 따라 인증에 3년이나 걸리기도 했다. 여기서 규제샌드박스란 이러..
와우! 우리나라 대학생이 코로나 확진자들의 이동 경로와 현황을 담은 일명 '코로나맵'을 제작했다. 질병관리본부의 데이터를 토대로 만들었다고 하며 이 데이터를 기반으로 실시간 업데이트가 된다고 한다. 어디서 볼 수 있는지 어떤 정보들이 표시되는지 직접 사용해본 정보를 포스팅해본다. 코로나바이러스 현황 지도 일단 코로나맵을 언급하기 전, 얼마전 미국 존스홉킨스대학 팀이 코로나 세계 감염 현황을 한눈에 볼 수 있는 지도를 공개했었다. 그리고 직접 써봤었다. [IT이슈] 코로나19 현황 세계지도? 직접 사용해봤습니다 [IT이슈] 코로나19 현황 세계지도? 직접 사용해봤습니다 코로나바이러스 현황 지도 얼마전 미국 존스홉킨스대학 팀이 코로나 세계 감염 현황을 한눈에 볼 수 있는 지도를 공개했다. 해당 지도는 어디서..
코로나바이러스 현황 지도 얼마전 미국 존스홉킨스대학 팀이 코로나 세계 감염 현황을 한눈에 볼 수 있는 지도를 공개했다. 해당 지도는 어디서 만들어진 것이고 어디서 볼 수 있는지, 그리고 직접 사용해보면서 적은 지도를 통해 확인해볼 수 있는 정보에는어떤 것들이 아주 디테일하게 있는지 봐본다. 코로나 바이러스 현황지도란? 미국 존스홉킨스대학의 CSSE팀이 세계보건기구(WHO)와 미국 질병통제예방센터(CDC) 등의 데이터를 활용해서 확진자의 위치와 분포, 확산 현황 등의 코로나 바이러스 정보를 시각화해서 만든 지도이다. 정식 명칭은 '우한 코로나바이러스 전 세계 현황 모음(Wuhan Coronavirus (2019-nCoV) Global Cases)’ 이다. 어떤 정보들을 볼 수 있는지 직접 하나하나 확인해보..
가상머신(Vmware) 네트워크 방식 3가지 Host-only(Vmnet1), Nat(Vmnet8), Bridge(Vmnet0)가 어떤 차이가 있는지 간단히 살펴본 후, ping으로 각각의 연결 상태를 실제로 확인해보려 한다. Host-only (Vmnet1) 연결 방식 Host-only 방식은 외부 네트워크와 연결 없이 Host-only 방식을 사용하는 Vmware끼리만 통신이 가능하다. 즉, Vmware끼리의 네트워크 대역이 따로 구축되어있다. 따라서 외부 네트워크, 호스트PC와는 통신이 안되고 서로 통신만 가능하다. 아래와 같이 Vmware 2개를 Host-only 방식으로 변경해본다. Host-only 방식으로 네트워크를 설정하면, Host PC와 Gateway의 192.168.0 대역과는 다르게..
이전 포스팅에서 알아보았던 Selenium(셀레니움) 사용법을 활용해서 비트코인 거래소 중 하나인 고팍스 메인페이지의 암호화폐 테이블 전체를 크롤링해서 엑셀에 저장해보려 한다. 참고로, webdriver를 설치하고 사용하는 방법과, Selenium(셀레니움) 을 사용해 element에 접근하는 방법 등은 페이지 하단의 '이전포스팅' 링크를 확인하길 바란다. 크롤링 대상 페이지 크롤링 대상 페이지는 이전 포스팅에서와 동일하게, 비트코인 거래소 중 하나인 '고팍스'이다. 많은 비트코인 거래소 중 이 페이지를 선택한 이유는 그냥 webdriver로 접근했을때 여기가 반응이 제일 빨랐기 때문이다. 제일 덜 복잡하고 가벼운 페이지 중 하나인 것 같다. 테이블 위치 확인 단순히 BeautifulSoup를 사용할때는..
애드고시 말만 들어봤지 막상 신청하려니 엄청 쫄렸었는데 나와 같은 쫄림을 겪고 있는 분들에게 조금이나마 도움이 될까 싶어 애드센스 승인 기간, 애드센스 신청 당시의 블로그 현황, 조건, 개인적으로 생각하는 조건 등을 후기로 작성해본다. + 이번 포스팅을 통해 아주 아주 주관적으로 인터넷에 떠도는 근거없는 소문을 불식시켜보고자 한다. 애드센스 승인 기간 "첫 포스팅: 2020.01.16" "신청 날짜: 2020.01.28" "승인 날짜: 2020.01.29" 첫 포스팅 날짜는 1월 16일이고 1월 28일에 애드센스 신청을 했다. 그리고 하루 뒤인 1월 29일에 승인이 됐으니 약 2주만에 애드센스 승인이 난 것이다. 애드센스 승인 조건 - 포스팅 수 "포스팅 수: 16개" 애드센스 신청을 한 시점까지의 여러..
파이썬으로 윈도우 레지스트리를 다뤄보는 이유는 보통 윈도우 배치파일(.bat) 을 생성할 때 필요하기 때문이다. 이번 포스팅에서는 파이썬 winreg 모듈을 사용해 '윈도우10 자동 업데이트 비활성화'를 가정하고 이를 위한 레지스트리 키를 생성하고 값을 등록해보려 한다. winreg 모듈 winreg는 윈도우 레지스터리에 관한 API를 제공하는 파이썬 모듈로 아래 링크에서 제공되는 API를 확인할 수 있다. Python 공식 홈페이지, winreg winreg — Windows registry access — Python 3.8.1 documentation winreg — Windows registry access These functions expose the Windows registry API to..