데이터 수집

London Financial Studies

프로그램 설명

공식 설명 읽기

데이터 수집

London Financial Studies

최근 데이터 마이닝 및 기계 학습과 같은 데이터 과학 기술의 인기가 엄청나게 증가했습니다. 리스크 관리자 및 재무 분석가가 이용할 수있는 방대한 양의 데이터를 처리하고 분석 할 수있는 효과적인 솔루션을 제시합니다.

컴퓨팅 성능 및 분산 처리가 발전함에 따라 여러 데이터 소스에서 수집 할 수있는 방대한 정보를 처리하고 이해할 수있게되었습니다.

이 실제 프로그램은 재무 데이터를 마이닝 할 때 사용할 수있는 감독 및 감독되지 않은 기계 학습의 여러 측면을 포함하는 주요 기술을 다루고 있습니다. 또한 NLP (Natural Language Processing) 및 DL (Deep Learning)과 같은 텍스트 분석 및 인공 지능 금융 시장에서 널리 사용되는 첨단 데이터 과학 기술에 중점을 둡니다.

이 프로그램은 전적으로 워크샵 및 사례 연구를 통해 제공됩니다. 참가자는 텍스트 문자열을 분석하기위한 정서 분석 모델을 구축하여 자연어 처리 기술을 구현하는 방법을 학습합니다. 심층 학습 섹션에서 참가자는 파이썬의 도움을 받아 재정적 문제를 해결하기 위해 신경망을 구성하고 테스트하는 데 중점을 둡니다.

대부분의 연습 및 사례 연구는 Python으로 설명되어 있으므로이 유연한 프로그래밍 언어로 작업하는 방법을 배울 수 있습니다.

날짜 : 2018 년 11 월 21 일 - 23 일

장소 : 런던 중심부

요금 : 1 일 £ 1325

우대 요금 적용 대상이 될 수 있습니다. 귀하의 회사가 LFS 글로벌 고객 프로그램의 회원인지 확인하려면 Google에 문의하십시오.


코스의 목적

  • 포트폴리오 관리자
  • 리스크 관리자
  • 일상적인 작업에서 데이터 마이닝 개념을 도입하려는 전문가
  • IT 개발자
  • 통계 학자
  • 퀀트 애널리스트
  • 금융 엔지니어
  • 컨설턴트


학습 목표

  • 데이터 마이닝 기법 및 도구에 대한 견고한 지식 기반을 구축하고 금융 산업에 적용
  • 자연 언어 처리 및 금융 학습에 관한 실습 경험 습득
  • 파이썬을 데이터 마이닝 및 프로세싱에 적용하고 실제 NLP 및 DL 문제를 해결하는 방법을 배웁니다.
  • 인공 신경 회로망 (ANN) 알고리즘에 대한 이해와 DL 모델의 설계, 구축 및 개발에이 알고리즘을 사용하는 방법


사전 지식

  • 통계의 기본 개념
  • 엑셀에 대한 좋은 지식
  • Python에 대한 사전 지식이 필요하지 않습니다.


강의 개요

첫날

데이터 마이닝 개요

데이터 마이닝의 다양한 구성 요소 배치

  • 연결 규칙
  • 분류 대 회귀 문제
  • 클러스터링 분석

데이터 시각화

  • 대규모 데이터 집합을 시각화하기위한 타사 솔루션 (Tableau, QlikeTech 등) 개요. 사례 연구는 matplotlib-library와 plly (오픈 소스 온라인 데이터 공동 작업 플랫폼)
  • 그래픽 데이터베이스 : 네트워크 이론을 포트폴리오 분석 및 그래픽 데이터베이스 소개에 적용
  • 이상치 탐지
  • 마할 라 노비스 거리

회귀 분석

  • OLS (일반 최소 자승)
  • 릿지 회귀
  • 희박
  • 올가미
  • 탄성 네트

워크숍 : 선물을 사용하여 대규모 실제 주식 포트폴리오의 최적 헤지 펀드를 마련하십시오. 포트폴리오는 글로벌 성격을 지니고 있지만 (100 주), 제한된 선물 세트 만 사용 가능합니다

주성분 분석 (PCA)

  • 이자율 및 묵시적 변동성의 기간 구조에 대한 주성분 분석
  • 주성분 회귀 분석 (PCR)
  • 부분 최소 제곱 (PLS)

워크샵 : PCA를 사용하여 역사적인 이자율 곡선의 큰 데이터 집합의 차원을 줄입니다. 이 커브의 복잡한 동작은 다른 성숙도에 걸쳐 분산되어 있으며이 기법을 사용하면 리스크 관리자가 금리 곡선의 역 동성을 훨씬 더 잘 볼 수 있습니다

데이터 분류 - 회귀 분석

커널 밀도 추정 및 분류

  • 커널 밀도 추정은 감독되지 않은 학습 절차로서, 비 매개 변수 분류를위한 간단한 절차 패밀리로 연결됩니다

사례 연구 : 재무 데이터의 확률 분포를 도출하기 위해 커널 사용

분류 - 제 1 편

  • Naive Bayes 분류 : 데이터를 분류하는 간단하고 강력한 기술

사례 연구 : 미국 은행의 다양한 속성을 포함하는 대용량 데이터 세트에 대한 베이시스 예측 변수 (Bayes-predictor)를 작성합니다. Bayes 분류기는 실패 할 가능성이있는 은행을 솔벤트로 유지하려는 은행과 분리하는 데 사용됩니다

분류 - 제 2 부

  • 강력한 데이터 마이닝 기술
  • 로지스틱 회귀

사례 연구 : 높은 차원의 실제 데이터 집합에 로그 회귀를 적용

둘째 날

데이터 분류 (계속)

분류 - 제 3 부

  • 분류 트리 : CART 모델링은 사용하기 쉬운 실제 결정 트리를 만듭니다
  • 의사 결정 트리의 개념은 랜덤 포레스트 (Random Forest) 및 포깅 (Bagging)과 같은 기술로 확장 될 것입니다.

사례 연구 : 비용 기능, 불순물 수준, 나무 가지 치기 및 상호 유효성 확인과 같은 개념이 상세하게 다루어집니다.

  • K- 가까운 이웃 학습
  • 로지스틱 회귀

사례 연구 : 분류 방법 (K-Nearest 및 CART)은 실제 금융 데이터 세트의 다양한 기술 지표 (RSI, MACD 등)에 적용될 예정입니다. 이렇게하면 이러한 분류 기준을 사용하여 서로 다른 속성의 강도에 따라 다른 버킷의 주식을 빠르게 분할하는 방법을 알 수 있습니다

워크샵 : 데이터 마이닝 도구

파이썬에 대한 소개 - 강력한 프로그래밍 언어

데이터 분석 영역에서 파이썬의 적용 가능성은 'scikit-learn'패키지를 사용한 기계 학습에 초점을 맞춘 실제 사례를 통해 설명 될 것입니다. 모든 예제는 Jupyter- 노트로 다룰 것입니다. 대표자는 Python으로 사용자 정의 보고서를 작성하는 방법을 배웁니다.

3 일째

자연 언어 처리

소셜 미디어 게시물, 이미지, 전자 메일, PDF 및 기타 구조화되지 않은 데이터의 출처에서 실제 가치를 추출하는 것은 기업에게 큰 도전입니다.

이 섹션에서는 구조화되지 않은 데이터에서 값을 추출하기 위해 자연 언어 처리 (NLP) 응용 프로그램을 다룹니다. 재무 뉴스의 정서 분석을 포함하여 금융의 비정형 데이터를 조사하는 실제 사례를 몇 가지 살펴 봅니다.

워크샵 : Python의 NLTK 패키지를 사용하여 :

  • Tf-Idf 및 백터 벡터를 사용하여 텍스트 탐색 및 토큰 화
  • 텍스트에서 단어 예측 : 텍스트에서 시작하는 단어 예측자를 작성합니다. 주어진 단어 뒤에 오는 단어를 예측할 수있는 프로그램 작성하기
  • 특정 주식에 대한 뉴스 항목의 정황을 이해합니다.

깊은 학습

기계 학습의 하위 분야 인 딥 학습 - 인공 신경망 (ANN) 알고리즘.

  • 깊은 학습 소개
  • 전달 전파
  • Word2vec 방식
  • 더 깊은 네트워크 및 전달 전파
  • 역 전파로 신경망 최적화

사례 연구 : Python으로 깊은 학습 모델 구축 (Keras 및 Tensorflow 패키지를 중심으로)

이 학교가 제공하는 프로그램은 :
  • 영어


마지막 업데이트 August 9, 2018
기간 및 가격
이 과정은 캠퍼스 기반
Start Date
시작일
11월 21, 2018
Duration
기간
3 일
전일제
Price
가격
3,975 GBP
1 일 £ 1325
Information
Deadline
Locations
영국 - London, England
시작일 : 11월 21, 2018
원서제출기한 학교와 연락
종료일 11월 23, 2018
Dates
11월 21, 2018
영국 - London, England
원서제출기한 학교와 연락
종료일 11월 23, 2018
동영상

LFS Webcast series - Applying Data-Mining in Finance