从零开始构建bootloader

项目步骤:

第一阶段:

​ 1、关看门狗;

​ 2、时钟初始化;

​ 3、内存初始化;

​ 4、NandFlash初始化;

​ 5、代码重定位(将flash中的代码复制到指定的内存地址处,也即代码段链接地址);

​ 6、跳转到main函数;

第二阶段:

​ 7、写main函数,在函数中设置要传给内核的参数;

​ 8、跳转到内核入口,启动内核

​ 9、制作链接脚本

第三阶段:

​ 10、编写Makefile文件;

​ 11、编译、下载、运行


1、编写start.S文件,初始化片上硬件

本文件需要完成的目标

1.关看门狗

2.设置时钟

3.开启指令缓存,初始化SDRAM

4.重定位(把bootloader本身的代码从flash复制到它的链接地址(c函数编写),然后清空bss段(c函数编写))

5.跳转到main函数。

#define CLKDIVN        0X4C000014    /*设置FCLK:HCLK:PCLK的比例*/
#define MPLLCON        0x4C000004    /*设置FCLK频率*/
#define S3C2440_MPLL_200MHZ     ((0x5c<<12)|(0x01<<4)|(0x02))
#define S3C2440_MPLL_400MHZ     ((0x5c<<12)|(0x01<<4)|(0x01))

#define WTCON    0x53000000        /*看门狗寄存器*/
#define BWSCON    0X48000000        /*BANK寄存器*/

.text                    /*设置代码段*/
.global _start            /*定义全局变量,要被链接脚本用到*/
_start:                    /*_start跳转到这里实现硬件初始化*/

    /* 1.关看门狗*/
    ldr r0, =WTCON
    mov r1, #0
    str r1, [r0]

    /* 2.设置时钟(必须设为异步总线模式) */
    ldr r0, =CLKDIVN
    mov r1, #5            /* FCLK:HCLK:PCLK=1:4:8 */
    str r1, [r0]

    mrc    p15, 0, r1, c1, c0, 0    /*设置为asynchronous bus mode*/
    orr    r1, r1, #0xc0000000
    mcr    p15, 0, r1, c1, c0, 0

    ldr r0, =MPLLCON            /* 设置时钟频率FCLK为400MHZ */
    ldr r1, =S3C2440_MPLL_400MHZ
    str r1, [r0]

    /* 3.使能ICache,加快指令访问速度;因为目前没有开启MMU,所以还不能开启数据缓存DCache */
    mrc p15, 0, r0, c1, c0, 0    /* read control reg */
    orr r0, r0, #(1<<12)
    mcr    p15, 0, r0, c1, c0, 0   /* write it back */


    /* 4.初始化SDRAM */
    ldr r0, =BWSCON
    adr r1, sdram_config         /* 使用adr跳转,因为SDRAM未初始化 */
    add r3, r0, #(13*4)
1:
    ldr r2, [r1], #4
    str r2, [r0], #4
    cmp r0, r3
    bne 1b                        /*back to 1 when no equal*/

    /* 4.重定位 */
    ldr sp, =0x34000000            /*因为SDRAM大小为64MB,所以堆栈指针设在最高地址处*/

    bl nand_init

    mov r0, #0                    /* src = r0 */
    ldr r1, =_start                /* dest = r1,_start为代码段的起始和链接地址0x30000000 */
    ldr r2, =__bss_start
    sub r2, r2, r1                /* len = r2,代码段长度*/

    bl copy_code_to_sdram        /* 调用C函数copy_code_to_sdram(src, dest, len)*/
    bl clear_bss                /* 清除bss段*/

/* 5.执行main */
    ldr lr, =halt
    ldr pc, =main
    mov pc,lr                    /* 若main函数跳出后,使PC等于lr链接寄存器,避免程序跑飞 */
halt:
    b halt                        /* 死循环,避免跑飞 */

sdram_config:
    .long 0x22011110     //BWSCON
    .long 0x00000700     //BANKCON0
    .long 0x00000700     //BANKCON1
    .long 0x00000700     //BANKCON2
    .long 0x00000700     //BANKCON3  
    .long 0x00000700     //BANKCON4
    .long 0x00000700     //BANKCON5
    .long 0x00018005     //BANKCON6
    .long 0x00018005     //BANKCON7
    .long 0x008C04F4     // REFRESH
    .long 0x000000B1     //BANKSIZE
    .long 0x00000030     //MRSRB6
    .long 0x00000030     //MRSRB7


  • 关于时钟频率的设置解释:

    • 将CPU频率设为最大值400MHZ(内核启动时间7S变为6S,因为HCLK和PCLK频率没有改变)
      然后分频系数FCLK:HCLK:PCLK需要设置为1:4:8。
    • 因为HCLK最高133MHZ,这里需要设置为100MHZ,PCLK最高50MHZ,所以这里需要设置为50HZ,所以得出 CLKDIVN寄存器需要等于0X5即可。
    • 具体为什么等于0x5,可以参考下图:

    image-20210109132950976

通过查看数据手册,得知当FCLK取400MHZ时,设置MDIV为0X5C,PDIV为0x1,SDIV为0x1。

  • 关于Cache的设置解释:

    • 通过高速缓存存储器可以加快对内存的数据访问,在CAHE中有ICAHE(指令缓存)和DCAHE(数据缓存):
      *ICAHE: * 指令缓存,用来存放执行这些数据的指令;
      *DCAHE: *用来存放数据,需要开启MMU才能开启DCAHE。
      在没开启ICAHE之前,CPU读取SDRAM地址数据时,每次都需要先访问一次地址值,在读数据.
      当开了ICAHE后,第一次读取SDRAM地址数据时,ICAHE发现缓存里没有这个地址数据,然后将SDRAM中需要读取的那部分一大块内存数据都复制在缓存中,后面陆续读取数据就不会再访问SDRAM了,直到CPU没有找到地址数据后ICAHE再从SDRAM中重新复制

    • 通过CP15协处理器来开启ICAHE:ICAHE控制位在CP15的寄存器C1中位12(如下图), 然后通过MRS和MSR向该位12置1,开启ICAHE.所以代码如下(放在SDRAM初始化之前):

    • mrc p15, 0, r0, c1, c0, 0      //将 CP15 的寄存器 C1 的值读到 r0 中
      orr r0, r0, #(1<<12)         //将r0中位12置1     
      mcr p15,0, r0,c1,c0,0        //开启ICAHE

2、编写init.c,用于重定位,bss段清除,初始化NandFlash

(1)编写nand_init()函数

准备知识:

我使用的NandFlash型号为K9F2G08U0M,通过查阅芯片手册获知该flash大小=2048块Block=128KPages=256MB=2Gb 。且其构成为:

1个设备=2048(Block)

1块Block=64(Pages)

1页=(2K+64)(Byte) 因为每个地址里都存放了一个字节,所以用Byte表示,其中64B是存放ECC的OOB地址,(ECC:存放判断位反转的校验码)

image-20210106224622373

  • 写过程:
    • 写页
    • 生成校验码ECC
    • 写校验码到OOB页中
  • 读过程:
    • 读出页数据,并计算当前数据的ECC
    • 读出存在OOB页里的原始ECC
    • 比较两个校验码,相同则读成功,不同则出现了位反转,需重新读取。

image-20210106225527801

image-20210106225610608

确定通信时序:

图3(2440-nandflash时序图)

  • 通过图2和图1可以看出:

tCS:等待芯片使能CE的时间, tCS=20nS

tCLS和tALS:等待WE(写信号)结束的时间, tCLS=tALS=15nS

tWP:WE(写信号)维持时间, tWP=15nS

tALH:等待命令写入成功的时间, tALH=5nS

tCLH:等待地址写入成功的时间, tCLH=5nS

  • 通过查看2440芯片手册,nandflash时序图,需要设置TACLS,TWRPH0和TWRPH1

TACLS:属于等待WE(写信号)就绪的时间,对比图2得出TACLS= tCLS- tWP=0nS

TWRPH0:属于WE(写信号)的时间, 对比图2得出TWRPH0= tWP=15nS

TWRPH1:属于等待命令写入成功的时间,对比图2得出TWRPH1=tALH=tCLH=5nS

  • 在NFCONF寄存器中设置这三个参数

TACLS[13:12] :表示Duration(持续时间)=HCLK*TACLS,由于Duration=0nS,所以TACLS=0

TWRPH0 [10:8] :表示Duration(持续时间)=HCLK*( TWRPH0+1),由于Duration=15nS,HCLK=10nS(100Mhz),所以TWRPH0 =1.

TWRPH1 [6:4] :表示Duration(持续时间)= HCLK*( TWRPH1 +1),由于Duration=5nS,HCLK=10nS(100Mhz),所以TWRPH1 =0

  • 代码如下:
/* nand flash  时序 */#define TACLS      0
#define TWRPH0     1
#define TWRPH1     0

/*     nand  flash  寄存器       */
#define   NFCONF     *((volatile unsigend long *)0X4E000000); //配置寄存器(用来设置时序)
#define   NFCONT     *((volatile unsigend long *)0X4E000000); //控制寄存器(用来使能nandflash控制器以及ECC编码器,还有控制芯片使能CE脚)
#define   NFCMMD    *((volatile unsigend char *)0X4E000000);//发送命令寄存器(命令只有8位)
#define   NFADDR     *((volatile unsigend char *)0X4E000000);//发送地址寄存器(地址只有8位)
#define   NFDATA      *((volatile unsigend int *)0X4E000000);//读/写数据寄存器(数据只有8位)
#define   NFSTAT      *((volatile unsigend int *)0X4E000000);//运行状态寄存器(用于判断RnB脚)

/*因为Nand Flash只有8位I/O脚,所以NFCMMD/ NFADDR/ NFDATA三个寄存器值都是unsigend char型  */

void nand_init(void)
{

 /* 设置时序 */
NFCONF = (TACLS<<12)|(TWRPH0<<8)|(TWRPH1<<4);

/* bit4=1:初始化ECC,  bit1=1:禁止片选  bit0=1:启动nandflash控制器*/    
NFCONT = (1<<4)|(1<<1)|(1<<0);

}

(2)编写nand_read()函数

在实现nand_read()函数前,还需要实现以下几个子函数:nand_select()、nand_deselect()、nand_cmd()、nand_waite_idle()、nand_read_data();

  • 1. 片选使能函数(在读写FLASH之前都要选中片选)
void nand_select(void)               //使能片选
{
    int i;
    NFCONT&=~(1<<1);        // NFCONT控制器位1置0
    for(i=0;i<10;i++);           //等待芯片使能成功
}
  • 2. 取消片选函数(在退出读写FLASH时要取消片选)
void nand_deselect(void)                 //取消片选
{
    int i;
    NFCONT&=~(1<<1);        // NFCONT控制器位1置0
    for(i=0;i<10;i++);           //等待芯片使能成功
}
  • 3. nand写命令
void nand_cmd(unsigned char cmd)
{
    volatile int i;
    NFCMMD = cmd;
    for (i = 0; i < 10; i++);
}
  • 4. 判断RnB状态函数(在写入所有命令后都要判断RnB脚是否为高电平就绪)
void nand_wait_ready(void)
{
    while (!(NFSTAT & 1));
}
  • 5. 读数据命令
unsigned char nand_data(void)
{
    return NFDATA;
}
  • 6. 写地址命令

首先Nand Flash引脚只有8位,然而地址共有2048(块)64(页)2KB,为了读出多个地址,如下图,所以需要分5个周期来实现发送地址:

image-20210106232716987

如上图,其中 A10~A0对应页大小(列),由于nandflash每页2048B,所以只用到A10~A0;

A28~A11对应页目录(行),表示共有2048块*64(每块有64页)个目录

例如,4097 地址就是:

A10~A0=4097%2048= 1(A0=1,其余为0)

A28~A11=4097/2048=2(A13=1,其余为0)

void nand_addr(unsigned int addr)
{
    unsigned int col  = addr % 2048;
    unsigned int page = addr / 2048;
    volatile int i;

    NFADDR = col & 0xff;        /* A7~A0,第1周期 */
    for (i = 0; i < 10; i++);

    NFADDR = (col >> 8) & 0xff;    /* A10~A8,第2周期 */
    for (i = 0; i < 10; i++);

    NFADDR  = page & 0xff;        /* A18~A11,第3周期 */
    for (i = 0; i < 10; i++);

    NFADDR  = (page >> 8) & 0xff;    /* A26~A19,第4周期 */
    for (i = 0; i < 10; i++);

    NFADDR  = (page >> 16) & 0xff;    /* A27~A28,第5周期 */
    for (i = 0; i < 10; i++);    
}
  • 7. nand 读数据命令

如上图,例如:当要reset复位nand flash时:

1) 使能片选nand_select();

2) 发送0XFF复位命令nand_cmd(0xFF);

3) 等待RnB状态是否就绪 nand_wait_idle();

4) 取消片选 nand_deselect();

Nand Flash读数据时序图

nand flash 读数据分为了以下几个步骤:

(1) 使能片选CE,将CLE置1,等待发送命令

(2) 将WE置低,将IO置为0X00,然后拉高WE,触发一次上升沿,则将把0x00写入flash中

(3) 将CLE置0,表示发送地址(分为5个周期)

(4) 发送读命令0X30

(5) 等待RnB信号为高电平

(6) 读数据(在同一页里,数据可以连续读,读下一页时,需要重新发送新的地址才行例如:读1000地址到2050地址时,

1.发出1000地址,到达页0的1000地址上,然后再连续读(2048-1000)次,直到读到页0的2047处.

2.再发出2048地址,到达页1的0地址上,然后连续读(2051-2048)次,直到读到2050为止)

(7) 取消片选nCE

/* 
* src:源地址,为32位地址,所以用unsigend int表示
* dest:目的地址内容,由于这里是将数据读出到目的地址内容中,所以需要用到*指针,
*       因为每个地址里存的是一个字节,所以用unsigend char型 
*/
void nand_read(unsigned int  src,unsigned char  *dest,unsigned int  len)
{

int col = src % 2048;      //第一次读,可能不是读的页首地址,所以需要记录当前页的位置
int i=0;                //当前读了0次

nand_select();           //1使能片选nCE     
while(i<len)
{ 
    nand_cmd(0X00);         //2发送读命令0X00  
    nand_addr(src);         // 3发送yuan地址(分为5个周期)
    nand_cmd(0X30);         //4发送读命令0X30    
    nand_wait_idle();       //5等待RnB信号为高电平

   for(;(col<2048)&&(i<len);col++)      //连续读页内数据
   {
       dest[i]=nand_read_data();            //6.读数据
       i++;
       src++;
   }
   col=0;
}
nand_deselect();                // 取消片选nCE
}

(3)编写重定位函数:copy_code_tosdram()

/**************************************************/
/*                      重定位函数                      */
/**************************************************/

/* 复制代码段(长度为len = __bss_start- _start)到SDRAM链接地址dest(0x30000000)处*/
void copy_code_to_sdram(unsigned char* src, unsigned char* dest, unsigned int len)
{    
    unsigned int i = 0;

    /* 判断nor启动还是nand启动 */
    if (isBootFromNorFlash())
    {
        while (i < len)            /*Nor启动,则直接复制*/
        {
            dest[i] = src[i];
            i++;
        }
    }
    else
    {
        nand_read((unsigned int)src, dest, len);
    }
}

(4)编写isBootFramNorFlash()函数,来判断nand启动还是nor启动

/*******************************************************/
/*                 判断是NOR启动还是NAND启动                */
/*******************************************************/

int isBootFromNorFlash(void)
{
    volatile int *p = (volatile int *)0;

    unsigned int tmp = *p;

    *p = 0x12345678;        /*向flash写*/
    if (*p == 0x12345678)
    {
        *p = tmp;            /* 若能成功写入,就是nand flash */
        return 0;
    }
    else
    {
        return 1;            /* 写不成功,就是NOR flash*/
    }
}

(5)编写clear_bss()函数

/******************************************************/
/*                      bss段清除函数                      */
/******************************************************/

void clear_bss(void)
{
    extern int __bss_start, __bss_end;
    int *p = &__bss_start;

    for (; p < &__bss_end; p++)
        *p = 0;
}

3、添加头文件: setup.h和serial.h

(1)添加串口支持文件

  • 将串口uart0初始化文件serial.c添加到当前工程目录中,并加以修改。
/*************************************************************/
/*                      初始化串口,实现终端显示                       */
/*************************************************************/

/* 串口引脚的GPIO设置寄存器 */
#define GPHCON              (*(volatile unsigned long *)0x56000070)
#define GPHUP               (*(volatile unsigned long *)0x56000078)

/* UART registers*/
#define ULCON0              (*(volatile unsigned long *)0x50000000)
#define UCON0               (*(volatile unsigned long *)0x50000004)
#define UFCON0              (*(volatile unsigned long *)0x50000008)
#define UMCON0              (*(volatile unsigned long *)0x5000000c)
#define UTRSTAT0            (*(volatile unsigned long *)0x50000010)
#define UTXH0               (*(volatile unsigned char *)0x50000020)
#define URXH0               (*(volatile unsigned char *)0x50000024)
#define UBRDIV0             (*(volatile unsigned long *)0x50000028)

/* 串口发送状态标志*/
#define TXD0READY   (1<<2)


#define PCLK            50000000    // PCLK = 50MHz
#define UART_CLK        PCLK        //  UART0的时钟=PCLK
#define UART_BAUD_RATE  115200      // 波特率115200
#define UART_BRD        ((UART_CLK  / (UART_BAUD_RATE * 16)) - 1)

/*
 * 初始化UART0
 * 115200,8N1,无校验
 */
void uart0_init(void)
{
    GPHCON  |= 0xa0;    // GPH2,GPH3����TXD0,RXD0
    GPHUP   = 0x0c;     // GPH2,GPH3�ڲ�����

    ULCON0  = 0x03;     // 8N1(8������λ���޽��飬1��ֹͣλ)
    UCON0   = 0x05;     // ��ѯ��ʽ��UARTʱ��ԴΪPCLK
    UFCON0  = 0x00;     // ��ʹ��FIFO
    UMCON0  = 0x00;     // ��ʹ������
    UBRDIV0 = UART_BRD; // ������Ϊ115200
}

/*
 * 输出单个字符
 */
void putc(unsigned char c)
{
    /* 等待串口准备好 */
    while (!(UTRSTAT0 & TXD0READY));

    /*向串口输入字符 */
    UTXH0 = c;
}

/*
 * 输出字符串
 */
void puts(char *str)
{
    int i = 0;
    while (str[i])
    {
        putc(str[i]);
        i++;
    }
}

/*
 * 输出val的16进制数表示,主要用于调试检查某内存地址的值是否正确
 */

void puthex(unsigned int val)
{
    /* 0x1234abcd */
    int i;
    int j;

    puts("0x");

    for (i = 0; i < 8; i++)
    {
        j = (val >> ((7-i)*4)) & 0xf;
        if ((j >= 0) && (j <= 9))
            putc('0' + j);
        else
            putc('A' + j - 0xa);

    }

}

(2)添加setup.h头文件

  • 因为TAG结构体定义是存在u-boot-1.1.6/include/asm-arm/setup.h中,所以设置TAG参数需要用到这个文件,将setup.h复制到当前工程目录下。

  • 修改setup.h文件,删除以下不需要的代码:

  • #define __tag __attribute__((unused, __section__(".taglist")))
    
    #define __tagtable(tag, fn) \
    
    static struct tagtable __tagtable_##fn __tag = { tag, fn }
    
    

define tag_member_present(tag,member) \

       ((unsigned long)(&((struct tag *)0L)->member + 1)  \

                 <= (tag)->hdr.size * 4)
  **得到以下setup.h文件:**

```c
#ifndef __ASMARM_SETUP_H
#define __ASMARM_SETUP_H

#define u8  unsigned char
#define u16 unsigned short
#define u32 unsigned long

/*
 * Usage:
 *  - do not go blindly adding fields, add them at the end
 *  - when adding fields, don't rely on the address until
 *    a patch from me has been released
 *  - unused fields should be zero (for future expansion)
 *  - this structure is relatively short-lived - only
 *    guaranteed to contain useful data in setup_arch()
 */
#define COMMAND_LINE_SIZE 1024

/* This is the old deprecated way to pass parameters to the kernel */
struct param_struct {
    union {
    struct {
        unsigned long page_size;        /*  0 */
        unsigned long nr_pages;            /*  4 */
        unsigned long ramdisk_size;        /*  8 */
        unsigned long flags;            /* 12 */
#define FLAG_READONLY    1
#define FLAG_RDLOAD        4
#define FLAG_RDPROMPT    8
        unsigned long rootdev;            /* 16 */
        unsigned long video_num_cols;    /* 20 */
        unsigned long video_num_rows;    /* 24 */
        unsigned long video_x;            /* 28 */
        unsigned long video_y;            /* 32 */
        unsigned long memc_control_reg;    /* 36 */
        unsigned char sounddefault;        /* 40 */
        unsigned char adfsdrives;        /* 41 */
        unsigned char bytes_per_char_h;    /* 42 */
        unsigned char bytes_per_char_v;    /* 43 */
        unsigned long pages_in_bank[4];    /* 44 */
        unsigned long pages_in_vram;    /* 60 */
        unsigned long initrd_start;        /* 64 */
        unsigned long initrd_size;        /* 68 */
        unsigned long rd_start;            /* 72 */
        unsigned long system_rev;        /* 76 */
        unsigned long system_serial_low;    /* 80 */
        unsigned long system_serial_high;    /* 84 */
        unsigned long mem_fclk_21285;       /* 88 */
    } s;
    char unused[256];
    } u1;
    union {
    char paths[8][128];
    struct {
        unsigned long magic;
        char n[1024 - sizeof(unsigned long)];
    } s;
    } u2;
    char commandline[COMMAND_LINE_SIZE];
};


/*
 * The new way of passing information: a list of tagged entries
 */

/* The list ends with an ATAG_NONE node. */
#define ATAG_NONE    0x00000000

struct tag_header {
    u32 size;
    u32 tag;
};

/* The list must start with an ATAG_CORE node */
#define ATAG_CORE    0x54410001

struct tag_core {
    u32 flags;        /* bit 0 = read-only */
    u32 pagesize;
    u32 rootdev;
};

/* it is allowed to have multiple ATAG_MEM nodes */
#define ATAG_MEM    0x54410002

struct tag_mem32 {
    u32    size;
    u32    start;    /* physical start address */
};

/* VGA text type displays */
#define ATAG_VIDEOTEXT    0x54410003

struct tag_videotext {
    u8        x;
    u8        y;
    u16        video_page;
    u8        video_mode;
    u8        video_cols;
    u16        video_ega_bx;
    u8        video_lines;
    u8        video_isvga;
    u16        video_points;
};

/* describes how the ramdisk will be used in kernel */
#define ATAG_RAMDISK    0x54410004

struct tag_ramdisk {
    u32 flags;    /* bit 0 = load, bit 1 = prompt */
    u32 size;    /* decompressed ramdisk size in _kilo_ bytes */
    u32 start;    /* starting block of floppy-based RAM disk image */
};

/* describes where the compressed ramdisk image lives (virtual address) */
/*
 * this one accidentally used virtual addresses - as such,
 * its depreciated.
 */
#define ATAG_INITRD    0x54410005

/* describes where the compressed ramdisk image lives (physical address) */
#define ATAG_INITRD2    0x54420005

struct tag_initrd {
    u32 start;    /* physical start address */
    u32 size;    /* size of compressed ramdisk image in bytes */
};

/* board serial number. "64 bits should be enough for everybody" */
#define ATAG_SERIAL    0x54410006

struct tag_serialnr {
    u32 low;
    u32 high;
};

/* board revision */
#define ATAG_REVISION    0x54410007

struct tag_revision {
    u32 rev;
};

/* initial values for vesafb-type framebuffers. see struct screen_info
 * in include/linux/tty.h
 */
#define ATAG_VIDEOLFB    0x54410008

struct tag_videolfb {
    u16        lfb_width;
    u16        lfb_height;
    u16        lfb_depth;
    u16        lfb_linelength;
    u32        lfb_base;
    u32        lfb_size;
    u8        red_size;
    u8        red_pos;
    u8        green_size;
    u8        green_pos;
    u8        blue_size;
    u8        blue_pos;
    u8        rsvd_size;
    u8        rsvd_pos;
};

/* command line: \0 terminated string */
#define ATAG_CMDLINE    0x54410009

struct tag_cmdline {
    char    cmdline[1];    /* this is the minimum size */
};

/* acorn RiscPC specific information */
#define ATAG_ACORN    0x41000101

struct tag_acorn {
    u32 memc_control_reg;
    u32 vram_pages;
    u8 sounddefault;
    u8 adfsdrives;
};

/* footbridge memory clock, see arch/arm/mach-footbridge/arch.c */
#define ATAG_MEMCLK    0x41000402

struct tag_memclk {
    u32 fmemclk;
};

struct tag {
    struct tag_header hdr;
    union {
        struct tag_core        core;
        struct tag_mem32    mem;
        struct tag_videotext    videotext;
        struct tag_ramdisk    ramdisk;
        struct tag_initrd    initrd;
        struct tag_serialnr    serialnr;
        struct tag_revision    revision;
        struct tag_videolfb    videolfb;
        struct tag_cmdline    cmdline;

        /*
         * Acorn specific
         */
        struct tag_acorn    acorn;

        /*
         * DC21285 specific
         */
        struct tag_memclk    memclk;
    } u;
};

struct tagtable {
    u32 tag;
    int (*parse)(const struct tag *);
};



#define tag_next(t)    ((struct tag *)((u32 *)(t) + (t)->hdr.size))
#define tag_size(type)    ((sizeof(struct tag_header) + sizeof(struct type)) >> 2)

#define for_each_tag(t,base)        \
    for (t = base; t->hdr.size; t = tag_next(t))

/*
 * Memory map description
 */
#define NR_BANKS 8

struct meminfo {
    int nr_banks;
    unsigned long end;
    struct {
        unsigned long start;
        unsigned long size;
        int           node;
    } bank[NR_BANKS];
};

extern struct meminfo meminfo;

#endif

4、编写boot.c文件,用于存放main函数

(1)编写main函数代码:

void main(void)

{

void (*theKernel)(int zero, int arch, unsigned int params); 

/*定义一个函数指针theKernel,其中第一个参数zero:0           */

/* arch:机器ID ,由于芯片类型很多,内核为了辨别芯片而定义的机器ID,其中2440芯片的ID号是362,*/

/* params :tag参数位置,这里我们的tag起始地址=0x30000100*/

  /*1 初 始 化 串 口 0 , 使 内 核 能 打 印 信 息  */

  uart0_init();                                             //调用serial.h头文件里的uart0_init()
  puts(“uart0 init OK\r\n”);                                //打印uart0初始化  

  /*2从  nand   flash  里 把 内 核 复 制 到  SDRAM  中 */

  puts(“copy  kernel  from  nand\r\n”);                  //打印内核复制
  nand_read((0x60000+64),0X30008000,0X200000);              //烧写2MB,多烧写点避免出错       

/*

0x60000+64:表示内核在nand(存储)地址上位置,

0X30008000:内核在sdram(运行)地址上位置

0X200000:内核长度2MB

因为Flash上存的内核格式是:uImage(64B头部(header)  + 真正的内核 )

在uboot界面中输入mtd命令可以看到:

              kernel分区位于 nand的0X00060000~0x00260000

所以在nand中真正的内核地址=0x60000+64,

在uboot界面中输入boot命令可以看到:

            Data Size:    1848656 Bytes =1.8 MB

            Load Address: 30008000

所以内核目的地址=0X30008000

长度=1.8MB

*/

  /*3 设  置  T  A  G  参  数        */

 puts(“set  boot  params\r\n”);                  //打印设置参数信息
 setup_start_tag (void);                      //在0X30000100地址保存start_tag数据,
 setup_memory_tags (void);                      //保存memory_tag数据,让内核知道内存多大
 setup_commandline_tag (“boottargs=noinitrd root=/dev/mtdblock3 init=/linuxrc console=ttySAC0”);  
 /*保存命令行bootargs参数,让内核知道根文件系统位置在/dev/mtdblock3,指定开机运行第一个脚本/linuxrc,指定打印串口0*/
 setup_end_tag (void);                            //初始化tag结构体结束


 /*  4 跳 转 执 行          */

   puts(“boot   kernel\r\n”);                      //打印启动内核
   theKernel = (void (*)(int, int, unsigend int))0x30008000;
    // 设置theKernel地址=0x30008000,用于后面启动内核
   theKernel(0,362,0x300000100);        //362:机器ID,  0x300000100: params(tag)地址
/*传递参数跳转执行到0x30008000启动内核,           */
/*相当于: mov r0,#0                             */
/*ldr r1,=362                                  */
/*ldr r2,= 0x300000100                         */
/*mov pc,#0x30008000                           */
  puts(“kernel  ERROR\r\n”);                  //打印内核启动出错

}

(2) 创建TAG参数 函数

创建tag参数函数代码如下:

#include “setup.h”              

static struct tag *params;               //定义个tag结构体变量params指针

void setup_start_tag (void)              //开始tag
{
    params = (struct tag *) 0x30000100;  //tag起始地址等于0X30000100
    params->hdr.tag = ATAG_CORE;         //头部常量tag=0x54410001
    params->hdr.size = tag_size (tag_core);    //size=5,

    params->u.core.flags = 0;
    params->u.core.pagesize = 0;
    params->u.core.rootdev = 0;
    params = tag_next (params);     //parmas=( struct tag *)((u32 *)parmas+ params->hdr.size)  
}

// setup_start_tag (bd)保存tag参数如下:
setup_memory_tags (void)                //内存tag
{

int i;
params->hdr.tag = ATAG_MEM;               //头部常量tag=0x54410002
params->hdr.size = tag_size (tag_mem32);       //size=4
params->u.mem.start = 0x30000000;            //SDRAM起始地址
params->u.mem.size = 0x4000000;             //SDRAM内存大小64M
params = tag_next (params);                  //指向下个tag
}  

// setup_memory_tag s(bd)保存tag参数如下:
int strlen(char  *str)          //uboot不依赖任何库,所以需要自己写strlen函数
{
   int  i=0;
   while(str[i])
   {
    i++;
   }
return i;
}

void strcpy(char  *dest, char  *src)
{  
   while((*dest++=*src++)!=’\0’&&*dest!=’\0’);  
}



setup_commandline_tag (char  *cmdline)     //命令行tag
/**cmdline :指向命令行参数                                                             */
/*一般为:“boottargs=noinitrd root=/dev/mtdblock3 init=/linuxrc console=ttySAC0”     */
{
 int len=strlen(cmdline)+1;                       //计算cmdline长度,并加上结束符
params->hdr.tag = ATAG_CMDLINE;             //头部常量tag=0x54410009
params->hdr.size =(sizeof (struct tag_header) +len+3) >> 2;    /*size=(字符串长度+头部长度) >>2 */
/*“+3”表示:按4字节对齐,比如当总长度=(1,2,3,4)时,size=(总长度+3)>>2=1,实现4字节对齐         */ 
strcpy (params->u.cmdline.cmdline, cmdline);      //复制形参字符串到params->u.cmdline.cmdline
params = tag_next (params);                    //执行下个tag
}


setup_end_tag (void)                            //结束tag
{
 params->hdr.tag = 0;                   
 params->hdr.size = 0;
}

5、编写链接脚本:boot.lds

(1)链接脚本语法提示:

1、1.lds链接脚本中每个符号(:或者=)左右都要加上空格或TAB按键 ;

. = ALIGN(4); 
.rodata:{*(.rodata)} //这里:左右没有空格,将出错,改为 .rodata : {*(.rodata*)}

2、lds链接脚本中{}和()后都不能加";"分号。

.rodata : {*(.rodata*)}; //这里"}"后面加了";"逗号,将出错

3、lds脚本sections中若是以当前地址.等于xxx时,.后面都要加空格;

.= 0x33f80000; //这里.后面没有加空格,出错  
. = 0x33f80000; 
. = ALIGN(4);

4、lds脚本中定义符号时,都要使符号在前。

__bss_start = .; 
.bss : { *(.bss) *(COMMON) }
. = __bss_end; //这里定义"__bss_end"符号出错,应该改为   __bss_end = .;

(2)链接脚本说明

  • 链接脚本中的0x33f80000就是链接地址(即程序运行时,该代码段将被链接到内存的此地址处),共512K空间存放bootloader;

  • 定义__bss_start和__bss_end符号,是用来在程序开始之前,将这些未定义的变量清0,节省内存且_bss_start-0x33f80000就等于代码的大小(即copy_code_tosdram函数中len值)。

  • SECTIONS {
        . = 0x33f80000;
    
        . = ALIGN(4);
        .text : { *(.text) }
    
        . = ALIGN(4);
        .rodata : {*(.rodata*)} 
    
        . = ALIGN(4);
        .data : { *(.data) }
    
        . = ALIGN(4);
        __bss_start = .;
        .bss : { *(.bss)  *(COMMON) }
        __bss_end = .;
    }

(3)NAND FLASH分区说明

一般在头文件中会通过MTDPARTS_DEFAULT宏定义,明确flash的分区设置,一般来说会分为4个区,依次存放bootloader、启动参数、内核映像、根文件系统。

bootloader 一开机直接运行u-boot
boot parameters 存放一些可以设置的参数,供u-boot使用
kernel 存放内核区
root filesystem 根文件系统,挂载(mount)后才能使用文件系统中的应用程序

(4)NAND Flash启动的架构和流程image-20201125230828425

启动流程为

  • 上电后,CPU内置程序会从NAND Flash的特定地址(一般是第一个block块地址)读出Boot-Loader程序到CPU的内部内存中。
  • CPU将控制权交给内部存储器中的Boot-Loader;
  • Boot-Loader初始化SDRAM,再从NAND Flash中将主程序载入到SDRAM中;
  • Boot-Loader将控制权交给主程序。

6、编写makefile文件

备注:在makefile中‘=’与‘:=’的区别:

‘=’ 无关位置的等于(比如:”x=a y=$(x) x=b”,那么y的值永远等于最后的值,等于 b ,而不是a)

‘:=’ 有关位置的等于(比如:”x:=a y:=$(x) x:=b”,那么y的值取决于当时位置的值,等于 a ,而不是b)

CC      = arm-linux-gcc               //定义CC变量=arm-linux-gcc,简化书写,编译命令,(*.C,*.S)文件生成*.O文件

LD      = arm-linux-ld                 //连接命令,将多个*.O文件生成 boot.elf       

AR      = arm-linux-ar                 //库管理命令,这里没有用到 

OBJCOPY = arm-linux-objcopy            //复制/格式转换命令, boot.elf生成boot.dis

OBJDUMP = arm-linux-objdump           //反汇编命令,boot.bin生成boot.dis


//GCC编译参数,-Wall:显示所有错误和警告, -O2:采用2级编译优化
CFLAGS           := -Wall -O2

//添加头文件参数,-nostdinc忽略缺省目录, -fno-builtin不连接系统标准启动文件和标准库文件(表示不用自带的strlen()等库函数)
CPPFLAGS     := -nostdinc -fno-builtin       


//定义objs变量,包含生成boot.bin目标文件需要的依赖文件
objs := start.o init.o boot.o 

//执行生成目标文件,首先是先满足objs所有依赖文件都拥有,才执行
boot.bin: $(objs)     
    ${LD} -Tuboot.lds -o boot_elf $^
    ${OBJCOPY} -O binary -S boot_elf $@
    ${OBJDUMP} -D -m arm boot_elf > boot.dis

//-c编译不连接。$@表示目标文件   $<表示第一个依赖文件
%.o:%.c
    ${CC} $(CPPFLAGS) $(CFLAGS) -c -o $@ $<   

%.o:%.S
    ${CC} $(CPPFLAGS) $(CFLAGS) -c -o $@ $<

clean:
    rm -f *.bin *.elf *.dis *.o

7、下载编译

(1)新建一个文件夹,并命名为bootloader,将以上编写好的:boot.c、init.c、start.S、setup.h、boot.lds和Makefile文件复制进去。然后将该bootloader文件夹通过共享文件夹或FileZilla软件拷贝进虚拟机linux环境下。

(2)在Linux环境下通过终端命令行进入到该bootloader文件夹中,执行make命令,进行编译、链接:

image-20210109214629292

(3)将得到的二进制文件boot.bin拷贝到Windows环境下的D盘根目录下。

(4)键盘“Win + R”组合键,输入cmd回车,打开WIndows下的命令行终端,输入命令d:进入D盘根目录。

(5)打开开发板电源,将JTAG-USB转接工具连接到电脑USB口,在WIndows命令行终端终端输入oflash boot.bin命令,运行FLASH烧录工具,将二进制目标文件烧录进目标板的NAND Flash中:

image-20210109215334715

(6)选择0回车,进入OpenJTAG模式,再依次键入1选择S3C2440目标板、后面都键入0完成烧录。

(7)用串口调试线连接开发板的COM口和电脑的USB口,打开MobaXterm串口连接工具,并连接到开发板。关闭开发板电源后,再重新接通电源,通过MobaXterm软件观察开发板启动情况。

(8)如果程序正确,将会看到开发板顺利启动内核并运行起来了linunx。

参考文章


获取更多知识,请点击关注:
嵌入式Linux&ARM
CSDN博客
简书博客
知乎专栏