wide form and long form
long.dta
stkcd year size 000001 2001 754 000001 2002 507 000001 2003 827 000002 2001 674 000002 2002 585 000002 2003 755
wide.dta
stkcd size2001 size2002 size2003 debt2001 debt2002 debt2003 000001 754 507 827 728 970 819 000002 674 585 755 605 662 614
Reshape from wide to long
待处理的 wide form 数据集 wide.dta 如下:
stkcd size2001 size2002 size2003 000001 754 507 827 000002 674 585 755
语法:reshape long stub, i(i) j(j)
stub应该是size,这是要从宽格式转换为长格式的变量i是标识变量,即宽格式中观测值的唯一标识符,j是年份变量,我们创建的变量。它告诉 Statasize的后缀(即 2001, 2002, 2003*),应该放在名为year的变量中。
use wide.dta, clear
reshape long size, i(stkcd) j(year)
list
Question 1
1. more than one stub
stkcd size2001 size2002 size2003 debt2001 debt2002 debt2003 000001 754 507 827 728 970 819 000002 674 585 755 605 662 614
2. complex unique identifier
stkcd type size2001 size2002 size2003 debt2001 debt2002 debt2003 000001 0 754 507 827 728 970 819 000001 1 926 769 890 955 680 919 000002 0 754 507 827 728 970 819 000002 1 651 566 569 976 568 958
3. character suffixes
stkcd size_east size_middle size_west debt_east debt_middle debt_west 000001 754 507 827 728 970 819 000002 674 585 755 605 662 614
Reshape from long to wide: reshape wide
待处理的 long form 数据集 long.dta 如下:
stkcd year size 000001 2001 754 000001 2002 507 000001 2003 827 000002 2001 674 000002 2002 585 000002 2003 755
语法:reshape wide stub, i(i) j(j)
stub应该是size,这是要从长格式转换为宽格式的变量i是标识变量,即长格式中观测值的唯一标识符,j是年份变量,它告诉 Stata 应该把year中的变量,作为后缀,作为新的size系列变量的变量名
use long.dta, clear
reshape wide size, i(stkcd) j(year)
list
Question 2
how
webuse airacc.dta, clear