는 구글에서 만든 머신러닝을 위한 오픈소스 소프트웨어 라이브러리다. 이 문서에 있는 모든 예제들은 TensorFlow를 기반으로 한다. 머신러닝이 뜨면서, 많은 종류의 머신러닝 애플리케이션들이 공개되고 있는데, 왜 TensorFlow를 선택했는지가 궁금할 것이다. 아래 그래프를 보자.이유는 간단하다. 누군가 머신러닝을 위해 사용하는 주요 라이브러리들에 대한...
"알파고" 4차산업, 딥러닝, 선행코딩교육, 특이점이 화제가 되게한 원인이다. GPU대신 TPU라는 하드웨어를 사용했다고 하는데, 이슈는 하드웨어가 아니었다. 딥러닝인지 뭔지를 이용해서 대국을 학습해서 인간계 최고의 프로기사를 이긴 소프트웨어였다. 하드웨어 파워로 따지자면 슈퍼컴퓨터 500위권에도 들지 못할 "형편없는?" 수준으로 인간을 이긴거다. 알파고와...
이전 장 에서 머신러닝이 무엇인지와 머신러닝에서 사용하는 기본적인 용어들에 대해서 살펴봤다. 이번 장에서는 머신러닝에서 널리 사용하는 선형회귀(lenear regression)를 살펴볼 것이다.공부시간에 따른 예상 성적을 알려주는 인공지능 프로그램을 만든다고 가정해보자. 머신러닝을 위한 "훈련데이터"를 준비했다. X축은 공부시간이고, Y축은 예상성적이다. ...
우리가 알고 있는 프로그램의 대부분은 Explicit programming이다. 어떻게 해결해야 할지가 명확한 프로그래밍이다. 순서도 같은 것으로 실행과정을 나타낼 수 있는 그런 프로그램이다. 내가 만들고 있는 프로그램도 거의 100% 이 영역에 속할 것이다. "if else"만으로 해결 할 수 있는 문제를 푸는 프로그램들이다.하지만 해결해야 할 문제가 복...
이 문서는 TensorFlow를 이용한 프로그래밍을 가이드 한다. 이 문서를 읽기전에 해야 한다. 이 문서를 활용하기 위해서는 아래의 사항을 알고 있어야 한다. 파이썬으로 프로그래밍 하는 법 적어도 배열이 뭔지는 알아야 한다. 가능 하면 기계 학습에 대한 것을 알고 있는게 좋다. 그러나 기계 학습에 대해서 전혀 모르더라도 읽을 수 있도록 만들었다.Tens...
아파치 하이브는 하둡위에 구축된 데이터 웨어하우스(Data warehouse)소프트웨어 프로젝트다. Hive는 하둡과 통합되며, SQL과 유사한 인터페이스를 이용해서 데이터를 질의 할 수 있다. 분산 시스템에서 SQL 응용 프로그램을 실해앟기 위해서는 MR을 이용해서 직접 SQL 쿼리를 구현해야 한다. 하이브를 이용하면 저수준의 쿼리를 구현할 필요 없이 S...
우리는 대기업이가지고 있는 모든 실시간 데이터를 처리 하기 위한 통합 플랫폼의 역할을 할 수 있도록 카프카를 설계했다. 이를 위해서 광범위한 유즈 케이스를 고려했다.실시간 로그 집계와 같은 대용량 이벤트 스트림을 처리하려면 높은 대역폭을 확보 할 수 있어야한다. 오프라인 시스템에서도 주기적인 데이터로드를 지원하기 위해서는 대규모의 백로그를 처리 할 수 있어...
YARN은 HDFS와 함께 하둡의 가장 중요한 구성요소다. YARN은 자원관리, 작업의 스케쥴링과 모니터링의 기능을 가진 별도의 데몬이다. 일종의 분산 커널이라고 볼 수 있다. 기본 아이디어는 RM(ResourceManager)과 애플리케이션별로 AM(ApplicationMater)을 구성하는 거다.RM은 하둡 클러스터를 구성하는 모든 응용 프로그램을 위해...
871 POSTS HERE
알고리즘
Solve Me First, Simple Array Sum, Compare the Triplets, A Very BigSum, Diagonal Difference, PlusMinus, Staircase, Birthday cake candles...
TensorFlow 소개
는 구글에서 만든 머신러닝을 위한 오픈소스 소프트웨어 라이브러리다. 이 문서에 있는 모든 예제들은 TensorFlow를 기반으로 한다. 머신러닝이 뜨면서, 많은 종류의 머신러닝 애플리케이션들이 공개되고 있는데, 왜 TensorFlow를 선택했는지가 궁금할 것이다. 아래 그래프를 보자.이유는 간단하다. 누군가 머신러닝을 위해 사용하는 주요 라이브러리들에 대한...
딥러닝 수업 개요
"알파고" 4차산업, 딥러닝, 선행코딩교육, 특이점이 화제가 되게한 원인이다. GPU대신 TPU라는 하드웨어를 사용했다고 하는데, 이슈는 하드웨어가 아니었다. 딥러닝인지 뭔지를 이용해서 대국을 학습해서 인간계 최고의 프로기사를 이긴 소프트웨어였다. 하드웨어 파워로 따지자면 슈퍼컴퓨터 500위권에도 들지 못할 "형편없는?" 수준으로 인간을 이긴거다. 알파고와...
Linear Regression의 Hypothesis와 Cost
이전 장 에서 머신러닝이 무엇인지와 머신러닝에서 사용하는 기본적인 용어들에 대해서 살펴봤다. 이번 장에서는 머신러닝에서 널리 사용하는 선형회귀(lenear regression)를 살펴볼 것이다.공부시간에 따른 예상 성적을 알려주는 인공지능 프로그램을 만든다고 가정해보자. 머신러닝을 위한 "훈련데이터"를 준비했다. X축은 공부시간이고, Y축은 예상성적이다. ...
Machine Learning 개념
우리가 알고 있는 프로그램의 대부분은 Explicit programming이다. 어떻게 해결해야 할지가 명확한 프로그래밍이다. 순서도 같은 것으로 실행과정을 나타낼 수 있는 그런 프로그램이다. 내가 만들고 있는 프로그램도 거의 100% 이 영역에 속할 것이다. "if else"만으로 해결 할 수 있는 문제를 푸는 프로그램들이다.하지만 해결해야 할 문제가 복...
Deep Learning
모두를 위한 머신러닝/딥러닝 강의를 정리한 스터디 노트다. 며칠에 하나씩 공부해가면서 완성해봐야 겠다....
TensorFlow 시작하기
이 문서는 TensorFlow를 이용한 프로그래밍을 가이드 한다. 이 문서를 읽기전에 해야 한다. 이 문서를 활용하기 위해서는 아래의 사항을 알고 있어야 한다. 파이썬으로 프로그래밍 하는 법 적어도 배열이 뭔지는 알아야 한다. 가능 하면 기계 학습에 대한 것을 알고 있는게 좋다. 그러나 기계 학습에 대해서 전혀 모르더라도 읽을 수 있도록 만들었다.Tens...
Apache Hive
아파치 하이브는 하둡위에 구축된 데이터 웨어하우스(Data warehouse)소프트웨어 프로젝트다. Hive는 하둡과 통합되며, SQL과 유사한 인터페이스를 이용해서 데이터를 질의 할 수 있다. 분산 시스템에서 SQL 응용 프로그램을 실해앟기 위해서는 MR을 이용해서 직접 SQL 쿼리를 구현해야 한다. 하이브를 이용하면 저수준의 쿼리를 구현할 필요 없이 S...
Kafka 디자인
우리는 대기업이가지고 있는 모든 실시간 데이터를 처리 하기 위한 통합 플랫폼의 역할을 할 수 있도록 카프카를 설계했다. 이를 위해서 광범위한 유즈 케이스를 고려했다.실시간 로그 집계와 같은 대용량 이벤트 스트림을 처리하려면 높은 대역폭을 확보 할 수 있어야한다. 오프라인 시스템에서도 주기적인 데이터로드를 지원하기 위해서는 대규모의 백로그를 처리 할 수 있어...
YARN
YARN은 HDFS와 함께 하둡의 가장 중요한 구성요소다. YARN은 자원관리, 작업의 스케쥴링과 모니터링의 기능을 가진 별도의 데몬이다. 일종의 분산 커널이라고 볼 수 있다. 기본 아이디어는 RM(ResourceManager)과 애플리케이션별로 AM(ApplicationMater)을 구성하는 거다.RM은 하둡 클러스터를 구성하는 모든 응용 프로그램을 위해...