可以使用train_test_split
函数来分割数据集为训练集和测试集。具体操作如下:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
其中,X
为特征数据集,y
为标签数据集,test_size
为测试集所占比例(通常取0.2表示20%的数据作为测试集),random_state
为随机种子,可以保证每次运行时划分的训练集和测试集是一样的。分割后,X_train
和y_train
为训练集的特征和标签,X_test
和y_test
为测试集的特征和标签。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 55@qq.com 举报,一经查实,本站将立刻删除。转转请注明出处:https://www.szhjjp.com/n/1024589.html