wide form and long form

long.dta

stkcd year size
000001 2001 754
000001 2002 507
000001 2003 827
000002 2001 674
000002 2002 585
000002 2003 755

wide.dta

stkcd size2001 size2002 size2003 debt2001 debt2002 debt2003
000001 754 507 827 728 970 819
000002 674 585 755 605 662 614

Reshape from wide to long

待处理的 wide form 数据集 wide.dta 如下:

stkcd size2001 size2002 size2003
000001 754 507 827
000002 674 585 755

语法:reshape long stub, i(i) j(j)

  1. stub 应该是 size,这是要从宽格式转换为长格式的变量
  2. i是标识变量,即宽格式中观测值的唯一标识符,
  3. j是年份变量,我们创建的变量。它告诉 Stata size 的后缀(即 2001, 2002, 2003*),应该放在名为 year 的变量中。
use wide.dta, clear
reshape long size, i(stkcd) j(year)
list

reshape long size output

Question 1

1. more than one stub

stkcd size2001 size2002 size2003 debt2001 debt2002 debt2003
000001 754 507 827 728 970 819
000002 674 585 755 605 662 614

2. complex unique identifier

stkcd type size2001 size2002 size2003 debt2001 debt2002 debt2003
000001 0 754 507 827 728 970 819
000001 1 926 769 890 955 680 919
000002 0 754 507 827 728 970 819
000002 1 651 566 569 976 568 958

3. character suffixes

stkcd size_east size_middle size_west debt_east debt_middle debt_west
000001 754 507 827 728 970 819
000002 674 585 755 605 662 614

Reshape from long to wide: reshape wide

待处理的 long form 数据集 long.dta 如下:

stkcd year size
000001 2001 754
000001 2002 507
000001 2003 827
000002 2001 674
000002 2002 585
000002 2003 755

语法:reshape wide stub, i(i) j(j)

  1. stub 应该是 size,这是要从长格式转换为宽格式的变量
  2. i 是标识变量,即长格式中观测值的唯一标识符,
  3. j 是年份变量,它告诉 Stata 应该把 year 中的变量,作为后缀,作为新的 size系列变量 的变量名
use long.dta, clear
reshape wide size, i(stkcd) j(year)
list

reshape wide size output

Question 2

how

webuse airacc.dta, clear