저도 처음에 Hevton 님과 같은 의문이 있었고 여러번 수행해 본 결론으로, 이 경우는 재생성이 맞습니다. 일단 Orange3의 학습 플로우가 오해를 가져올 수 있는 부분이라고 생각하구요, 애초에 첫 호출로 '파일'을 설정할 때 학습/테스트 데이터 비율을 나눈다거나 파일 노드에서 다른 파일 호출 옵션이 있었다면 이런 오해가 발생하진 않았겠지요.
초반에 테스트셋 지정 옵션이 없다보니 모델 노드를 붙이고 나서 굳이 테스트&스코어 노드를 둠으로써, 모델 재생성 및 재학습 효과가 발생하는 것입니다.
오해가 있을 수 있는데, 먼저 강의에서 학습/평가는 분명 전체 데이터셋으로 진행된 것이고, 테스트/스코어가 처리된 것은 모델이 다시 생성되어 7(학습):3(테스트) 등 비율로 나뉜 데이터에 대해 평가가 이루어진 것으로 보시면 됩니다. 즉 새롭게 학습 및 테스트셋에 대한 평가가 이루어 진 것이죠.
Test and Score 내용이 다소 이해가 가지 않습니다.
Train Data와 Linear Regression을 연결시킨다는 것은
Linear Regression의 학습방식으로 모델을 생성시키게 된다는 것으로 이해했습니다.
근데 둘을 연결함으로써 이미 전체 데이터를 기반으로 생성되었을 모델을 Test and Score에 연결한다고 해서 Train Data / Test Data 를 구분지어 결과를 낼 수 있다는게 어떻게 가능한지 궁금합니다.