Linux網(wǎng)絡(luò)設(shè)備驅(qū)動編程
在此僅僅討論網(wǎng)絡(luò)設(shè)備驅(qū)動的一般寫法,有關(guān)硬件部分的相關(guān)代碼由于硬件規(guī)格不同,予以省略。有什么地方錯(cuò)誤,或補(bǔ)充,歡迎大家提出。
1.驅(qū)動模塊的加載和卸載
如果網(wǎng)絡(luò)設(shè)備(包括wireless)是PCI規(guī)范的,則先是向內(nèi)核注冊該P(yáng)CI設(shè)備(pci_register_driver),然后由pci_driver數(shù)據(jù)結(jié)構(gòu)中的probe函數(shù)指針?biāo)赶虻膫蓽y函數(shù)來初始化該P(yáng)CI設(shè)備,并且同時(shí)注冊和初始化該網(wǎng)絡(luò)設(shè)備。
如果網(wǎng)絡(luò)設(shè)備(包括wireless)是PCMCIA規(guī)范的,則先是向內(nèi)核注冊該P(yáng)CMCIA設(shè)備(register_pccard_driver),然后driver_info_t數(shù)據(jù)結(jié)構(gòu)中的attach函數(shù)指針?biāo)赶虻膫蓽y函數(shù)來初始化該P(yáng)CMCIA設(shè)備,并且同時(shí)注冊和初始化該網(wǎng)絡(luò)設(shè)備。
static int __init tg3_init(void)
{
//先注冊成PCI設(shè)備,并初始化,如果是其他的ESIA,PCMCIA,用其他函數(shù)
return pci_module_init(&tg3_driver);
}
static void __exit tg3_cleanup(void)
{
pci_unregister_driver(&tg3_driver);//注銷PCI設(shè)備
}
module_init(tg3_init); //驅(qū)動模塊的加載
module_exit(tg3_cleanup); //驅(qū)動模塊的卸載
申明為PCI設(shè)備:
static struct pci_driver tg3_driver = {
.name = DRV_MODULE_NAME,
.id_table = tg3_pci_tbl, //此驅(qū)動所支持的網(wǎng)卡系列,vendor_id, device_id
.probe = tg3_init_one, //初始化網(wǎng)絡(luò)設(shè)備的回調(diào)函數(shù)
.remove = __devexit_p(tg3_remove_one), //注銷網(wǎng)絡(luò)設(shè)備的回調(diào)函數(shù)
.suspend = tg3_suspend, //設(shè)備掛起函數(shù)
.resume = tg3_resume //設(shè)備恢復(fù)函數(shù)
};
2.PCI設(shè)備探測函數(shù)probe,初始化網(wǎng)絡(luò)設(shè)備
static int __devinit tg3_init_one(struct pci_dev *pdev, const struct pci_device_id *ent)
{
//初始化設(shè)備,使I/O,memory可用,喚醒設(shè)備
pci_enable_device(pdev);
//申請內(nèi)存空間,配置網(wǎng)卡的I/O,memory資源
pci_request_regions(pdev, DRV_MODULE_NAME);
pci_set_master(pdev);
//設(shè)置DMA屬性
pci_set_dma_mask(pdev, (u64) 0xffffffffffffffff);
//網(wǎng)卡 I/O,memory資源的啟始地址
tg3reg_base = pci_resource_start(pdev, 0);
//網(wǎng)卡I/O,memory資源的大小
tg3reg_len = pci_resource_len(pdev, 0);
//分配并設(shè)置網(wǎng)絡(luò)設(shè)備
dev = alloc_etherdev(sizeof(*tp));
//申明為內(nèi)核設(shè)備模塊
SET_MODULE_OWNER(dev);
//初始化私有結(jié)構(gòu)中的各成員值
tp = dev->priv;
tp->pdev = pdev;
tp->dev = dev;
……
//鎖的初始化
spin_lock_init(&tp->lock);
//映射I/O,memory地址到私有域中的寄存器結(jié)構(gòu)
tp->regs = (unsigned long) ioremap(tg3reg_base, tg3reg_len);
dev->irq = pdev->irq;
//網(wǎng)絡(luò)設(shè)備回調(diào)函數(shù)賦值
dev->open = tg3_open;
dev->stop = tg3_close;
dev->get_stats = tg3_get_stats;
dev->set_multicast_list = tg3_set_rx_mode;
dev->set_mac_address = tg3_set_mac_addr;
dev->do_ioctl = tg3_ioctl;
dev->tx_timeout = tg3_tx_timeout;
dev->hard_start_xmit= tg3_start_xmit;
//網(wǎng)卡的MAC地址賦值dev->addr
tg3_get_device_address(tp);
//注冊網(wǎng)絡(luò)設(shè)備
register_netdev(dev);
//把網(wǎng)絡(luò)設(shè)備指針地址放入PCI設(shè)備中的設(shè)備指針中
pci_set_drvdata(pdev, dev);
}
3.注銷網(wǎng)絡(luò)設(shè)備
static void __devexit tg3_remove_one(struct pci_dev *pdev)
{
struct net_device *dev = pci_get_drvdata(pdev);
//注銷網(wǎng)絡(luò)設(shè)備
unregister_netdev(dev);
//取消地址映射
iounmap((void *) ((struct tg3 *)(dev->priv))->regs);
//釋放網(wǎng)絡(luò)設(shè)備
kfree(dev);
//釋放PCI資源
pci_release_regions(pdev);
//停用PCI設(shè)備
pci_disable_device(pdev);
//PCI設(shè)備中的設(shè)備指針賦空
pci_set_drvdata(pdev, NULL);
}
4.打開網(wǎng)絡(luò)設(shè)備
static int tg3_open(struct net_device *dev)
{
//分配一個(gè)中斷
request_irq(dev->irq, tg3_interrupt, SA_SHIRQ, dev->name, dev);
/* int request_irq(unsigned int irq,
void (*handler)(int irq, void *dev_id, struct pt_regs *regs),
unsigned long irqflags,
const char * devname,
void *dev_id);
irq是要申請的硬件中斷號。在Intel平臺,范圍0--15。handler是向系統(tǒng)登記的中斷處理函數(shù)。這是一個(gè)回調(diào)函數(shù),中斷發(fā)生時(shí),系統(tǒng)調(diào)用這個(gè)函數(shù),傳入的參數(shù)包括硬件中斷號,device id,寄存器值。dev_id就是下面的request_irq時(shí)傳遞給系統(tǒng)的參數(shù)dev_id。irqflags是中斷處理的一些屬性。比較重要的有SA_INTERRUPT,標(biāo)明中斷處理程序是快速處理程序(設(shè)置SA_INTERRUPT)還是慢速處理程序(不設(shè)置SA_INTERRUPT)??焖偬幚沓绦虮徽{(diào)用時(shí)屏蔽所有中斷。慢速處理程序不屏蔽。還有一個(gè)SA_SHIRQ屬性,設(shè)置了以后運(yùn)行多個(gè)設(shè)備共享中斷。dev_id在中斷共享時(shí)會用到。一般設(shè)置為這個(gè)設(shè)備的device結(jié)構(gòu)本身或者NULL。中斷處理程序可以用dev_id找到相應(yīng)的控制這個(gè)中斷的設(shè)備,或者用rq2dev_map找到中斷對應(yīng)的設(shè)備。*/
//初始化硬件
tg3_init_hw(tp);
//初始化收包和發(fā)包的緩沖區(qū)
tg3_init_rings(tp);
//初始化定時(shí)器
init_timer(&tp->timer);
tp->timer.expires = jiffies + tp->timer_offset;
tp->timer.data = (unsigned long) tp;
tp->timer.function = tg3_timer; //超時(shí)回調(diào)函數(shù)
add_timer(&tp->timer);
//允許網(wǎng)卡開始傳輸包
netif_start_queue(dev);
}
5.關(guān)閉網(wǎng)絡(luò)設(shè)備
static int tg3_close(struct net_device *dev)
{
//停止網(wǎng)卡傳輸包
netif_stop_queue(dev);
netif_carrier_off(tp->dev);
//去除定時(shí)器
del_timer_sync(&tp->timer);
//釋放收包和發(fā)包的緩沖區(qū)
tg3_free_rings(tp);
//釋放中斷
free_irq(dev->irq, dev);
}
[NextPage]
6.硬件處理數(shù)據(jù)包發(fā)送
static int tg3_start_xmit(struct sk_buff *skb, struct net_device *dev)
{
len = (skb->len - skb->data_len);
//以DMA方式向網(wǎng)卡物理設(shè)備傳輸包。如果是wireless的話,需要根據(jù)802.11協(xié)議及硬件的規(guī)范從新填充
//硬件幀頭,然后提交給硬件發(fā)送。
mapping = pci_map_single(tp->pdev, skb->data, len, PCI_DMA_TODEVICE);
tp->tx_buffers[entry].skb = skb;
pci_unmap_addr_set(&tp->tx_buffers[entry], mapping, mapping);
//硬件發(fā)送
tg3_set_txd(tp, entry, mapping, len, base_flags, mss_and_is_end);
//記錄發(fā)包開始時(shí)間
dev->trans_start = jiffies;
}
7.中斷處理收包,發(fā)包
static void tg3_interrupt(int irq, void *dev_id, struct pt_regs *regs)
{
//如果要收包
tg3_rx(tp);
//如果要發(fā)包
tg3_tx(tp);
}
8.發(fā)包
static void tg3_tx(struct tg3 *tp)
{
struct tx_ring_info *ri = &tp->tx_buffers[sw_idx];
struct sk_buff *skb = ri->skb;
//以DMA方式向網(wǎng)卡傳輸包完畢
pci_unmap_single(tp->pdev, pci_unmap_addr(ri, mapping),
(skb->len - skb->data_len), PCI_DMA_TODEVICE);
ri->skb = NULL;
dev_kfree_skb_irq(skb);
}
9.收包
static int tg3_rx(struct tg3 *tp, int budget)
{
struct sk_buff *copy_skb;
//分配一個(gè)包
copy_skb = dev_alloc_skb(len + 2);
copy_skb->dev = tp->dev;
//修改包頭空間
skb_reserve(copy_skb, 2);
//加入數(shù)據(jù)到包中
skb_put(copy_skb, len);
//以DMA方式從網(wǎng)卡傳輸回?cái)?shù)據(jù)
pci_dma_sync_single(tp->pdev, dma_addr, len, PCI_DMA_FROMDEVICE);
memcpy(copy_skb->data, skb->data, len);
skb = copy_skb;
//解析包的協(xié)議
skb->protocol = eth_type_trans(skb, tp->dev);
//把包送到協(xié)議層
netif_rx(skb);
//記錄收包時(shí)間
tp->dev->last_rx = jiffies;
}
10.讀取包的網(wǎng)卡收發(fā)包的狀態(tài),統(tǒng)計(jì)數(shù)據(jù)
static struct net_device_stats *tg3_get_stats(struct net_device *dev)
{
//從硬件相關(guān)的寄存器讀取數(shù)據(jù),累加
//stats->rx_packets, stats->tx_packets, stats->rx_bytes, stats->tx_bytes等
}
11.用戶的ioctl命令系統(tǒng)調(diào)用
static int tg3_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
{
struct mii_ioctl_data *data = (struct mii_ioctl_data *)&ifr->ifr_data;
switch(cmd) {
//ethtool程序命令的調(diào)用
case SIO*HTOOL:
return tg3_ethtool_ioctl(dev, (void *) ifr->ifr_data);
//mii程序命令的調(diào)用
case SIOCGMIIREG: {
err = tg3_readphy(tp, data->reg_num & 0x1f, &mii_regval)
data->val_out = mii_regval;
return err;
}
……
}
}
12.PCI設(shè)備的掛起和恢復(fù)函數(shù)
static int tg3_suspend(struct pci_dev *pdev, u32 state)
{
//停用網(wǎng)卡的中斷寄存器
tg3_disable_ints(tp);
//停止網(wǎng)卡收發(fā)包
netif_device_detach(dev);
//停止網(wǎng)卡某些硬件,fireware的一些功能
tg3_halt(tp);
//設(shè)置網(wǎng)卡的電源狀態(tài)
tg3_set_power_state(tp, state);
}
static int tg3_resume(struct pci_dev *pdev)
{
//恢復(fù)網(wǎng)卡電源
tg3_set_power_state(tp, 0);
//允許網(wǎng)卡收發(fā)包
netif_device_attach(dev);
//初始化收發(fā)包的緩沖區(qū)
tg3_init_rings(tp);
//初始化網(wǎng)卡硬件
tg3_init_hw(tp);
//打開網(wǎng)卡中斷寄存器
tg3_enable_ints(tp);
}
13.參數(shù)設(shè)置
在驅(qū)動程序里還提供一些方法供系統(tǒng)對設(shè)備的參數(shù)進(jìn)行設(shè)置和讀取信息。一般只有超級用戶(root)權(quán)限才能對設(shè)備參數(shù)進(jìn)行設(shè)置。設(shè)置方法有:
tg3_set_mac_addr (dev->set_mac_address)
當(dāng)用戶調(diào)用ioctl類型為SIOCSIFHWADDR時(shí)是要設(shè)置這個(gè)設(shè)備的mac地址。一般對mac地址的設(shè)置沒有太大意義的。
dev->set_config()
當(dāng)用戶調(diào)用ioctl時(shí)類型為SIOCSIFMAP時(shí),系統(tǒng)會調(diào)用驅(qū)動程序的set_config方法
用戶會傳遞一個(gè)ifmap結(jié)構(gòu)包含需要的I/O、中斷等參數(shù)。
總結(jié):
所有的Linux網(wǎng)絡(luò)驅(qū)動程序遵循通用的接口。設(shè)計(jì)時(shí)采用的是面向?qū)ο蟮姆椒?。一個(gè)設(shè)備就是一個(gè)對象(net_device 結(jié)構(gòu)),它內(nèi)部有自己的數(shù)據(jù)和方法。一個(gè)網(wǎng)絡(luò)設(shè)備最基本的方法有初始化,發(fā)送和接收。
Linux網(wǎng)絡(luò)驅(qū)動程序的體系結(jié)構(gòu)可以劃分為四層:
網(wǎng)絡(luò)協(xié)議接口,網(wǎng)絡(luò)設(shè)備接口,設(shè)備驅(qū)動功能,網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)媒介層
網(wǎng)絡(luò)驅(qū)動程序,最主要的工作就是完成設(shè)備驅(qū)動功能層。在Linux中所有網(wǎng)絡(luò)設(shè)備都抽象為一個(gè)接口,這個(gè)接口提供了對所有網(wǎng)絡(luò)設(shè)備的操作集合。由數(shù)據(jù)結(jié)構(gòu)struct net_device來表示網(wǎng)絡(luò)設(shè)備在內(nèi)核中的運(yùn)行情況,即網(wǎng)絡(luò)設(shè)備接口。它既包括純軟件網(wǎng)絡(luò)設(shè)備接口,如環(huán)路(Loopback),也包括硬件網(wǎng)絡(luò)設(shè)備接口,如以太網(wǎng)卡。而由以dev_base為頭指針的設(shè)備鏈表來集體管理所有網(wǎng)絡(luò)設(shè)備,該設(shè)備鏈表中的每個(gè)元素代表一個(gè)網(wǎng)絡(luò)設(shè)備接口。數(shù)據(jù)結(jié)構(gòu)net_device中有很多供系統(tǒng)訪問和協(xié)議層調(diào)用的設(shè)備方法,包括初始化,打開和關(guān)閉網(wǎng)絡(luò)設(shè)備的open和stop函數(shù),處理數(shù)據(jù)包發(fā)送的hard_start_xmit函數(shù),以及中斷處理函數(shù)等。
網(wǎng)絡(luò)設(shè)備在Linux里做專門的處理。Linux的網(wǎng)絡(luò)系統(tǒng)主要是基于BSD unix的socket機(jī)制。在系統(tǒng)和驅(qū)動程序之間定義有專門的數(shù)據(jù)結(jié)構(gòu)(sk_buff)進(jìn)行數(shù)據(jù)的傳遞。系統(tǒng)里支持對發(fā)送數(shù)據(jù)和接收數(shù)據(jù)的緩存,提供流量控制機(jī)制,提供對多協(xié)議的支持。
angal