glmnet 예제

 Senast ändrad 2 augusti, 2019 kl 07:21
aug 022019
 

따라서, 천식 상태를 예측하기 위해 위의 데이터와 LASSO를 사용하여이 모의 예에 대한 설명과 함께 샘플 R 스크립트를 기꺼이 제공 하려는 사람이 있습니까? 아주 기본적인 있지만, 나는, 나는, 그리고 이력서에 가능성이 많은 다른 사람을 알고, 크게이 주셔서 감사합니다! TRUE인 경우 각 접기에 맞게 병렬 foreach를 사용합니다. doMC 등 핸드 전에 병렬로 등록해야 합니다. 아래 예제를 참조하십시오. 그냥 팻에 의해 제공되는 우수한 예에 확장합니다. 원래 문제는 레벨 사이에 내재된 순서(0 < 1 < 2 < 3)와 함께 서수 변수(m_edu, p_edu)를 발생시켰습니다. 팻의 원래 대답에서 나는 이들이 그들 사이에 순서가없는 명목 범주형 변수로 취급되었다고 생각합니다. 나는 틀렸을 지 모르지만, 모델이 고유의 순서를 존중할 수 있도록 이러한 변수를 코딩해야한다고 생각합니다. 이러한 순서요인으로 코딩된 경우(팻의 대답과 같이 정렬되지 않은 요인이 아닌) glmnet은 약간 다른 결과를 제공합니다… 아래의 코드는 정렬 된 요인으로 서수 변수를 올바르게 포함하고 약간 다른 결과를 제공한다고 생각합니다:이 예제의 목표는 LASSO를 사용하여 6 개의 잠재적 예측 변수 목록에서 어린이 천식 상태를 예측하는 모델을 만드는 것입니다. 변수(나이, 성별, bmi_p, m_edu, p_edu 및 f_color). 분명히 샘플 크기는 여기에 문제가 있지만 결과가 이진 (1 = 천식; 0 = 천식 없음)일 때 glmnet 프레임 워크 내에서 다양한 유형의 변수 (즉, 연속, 서수, 명목 및 바이너리)를 처리하는 방법에 대한 더 많은 통찰력을 얻고자합니다.

다음은 새 데이터를 예측하는 데 필요한 두 가지 사항입니다. 예를 들어, 값을 예측하고 학습한 데이터에 대한 R2 값을 계산합니다. Hastie, T. 및 Tibshirani, R. (2008) 좌표 하강을 통해 일반화 선형 모델에 대한 정규화 경로, 통계 소프트웨어의 https://web.stanford.edu/~hastie/Papers/glmnet.pdf 저널, Vol. 33 (1), 1-22 2010 년 2 월 http://www.jstatsoft.org/v33/i01/ 사이먼, N., 프리드먼, J., 하스티, T., Tibshirani, R. (2011) 정규화 경로 통계 소프트웨어, Vol. 39(5) 1-13 http://www.jstatsoft.org/v39/i05/ 티브시라니, 로버트., 비엔, J., 프리드먼, J., 하스티, T., 사이먼, N., 테일러, J. 및 티시라니, 라이언. (2012) 올가미 형 문제, JRSSB vol 74, http://statweb.stanford.edu/~tibs/ftp/strong.pdf 스탠포드 통계 기술 보고서 글름넷 비네트 https://web.stanford.edu/~hastie/glmnet/glmnet_alpha.html 우리는 방법의 수학적 특성뿐만 아니라 실용적인 R 예제, 플러스 몇 가지 추가 조작 및 트릭을 모두 다룰 것입니다. 더 이상 애타게 시작하지 않고 시작합시다! 최적의 모델은 학습 데이터의 분산의 93%를 차지합니다.

이 문제를 해결할 수 있는 방법에는 두 가지가 있습니다. 보다 전통적인 접근 방식은 일부 정보 기준(예: AIC 또는 BIC)이 가장 작도록 λ를 선택하는 것입니다. 더 많은 기계 학습과 같은 접근 방식은 교차 유효성 검사를 수행하고 교차 검증된 제곱 잔류(또는 다른 측정값)의 교차 검증된 합계를 최소화하는 λ 값을 선택하는 것입니다. 전자 접근 방식은 모델이 데이터에 적합하다는 것을 강조하는 반면, 후자는 예측 성능에 더 중점을 두습니다. 둘 다 논의해 봅시다. 통계에는 스페이스트라의 두 가지 중요한 특성인 바이어스와 분산이 있습니다. 바이어스는 실제 모집단 매개변수와 예상 추정기의 차이입니다: 아이디어는 손실 함수에 가중치를 도입하여 서로 다른 강도의 다른 계수를 불이익을 주는 것입니다: 선형에 포함된 길이 노브의 벡터 예측 변수(”다항식” 패밀리에 대한 노브 x NC 행렬).

Tyvärr, det är nu stängt för kommentarer här.

© 2011 Radiostyrd Bilsport Suffusion theme by Sayontan Sinha