Linux中的目標文件

来源:https://www.cnblogs.com/baobaobashi/archive/2023/01/23/17063448.html
-Advertisement-
Play Games

eunomia-bpf 0.3.0 發佈:只需編寫內核態代碼,輕鬆構建、打包、發佈完整的 eBPF 應用 eunomia-bpf 簡介 eBPF 源於 BPF,本質上是處於內核中的一個高效與靈活的虛擬機組件,以一種安全的方式在許多內核 hook 點執行位元組碼,開發者可基於 eBPF 開發性能分析工具 ...


一、目標文件的格式

Linux:ELF(Executable Linkable Format)
Windows:PE(Portable Executable)

COFF格式:PE和ELF都是源自COFF格式,Unix最早是a.out文件格式,為瞭解決共用庫問題,引入了COFF格式。

  • 引入了段的機制,不同目標文件可以擁有不同數量的段和類型
  • 定義了調試數據格式

二、目標文件是什麼?

目標文件就是與那代碼編譯後但未能鏈接的那些中間文件。(Linux中的.o,Windows中的.obj)

4種ELF文件

image

三、Linux中的目標文件

目標文件是經過了預處理、編譯、彙編產生的ELF格式的文件。目標文件將代碼、數據以及一些連接時需要的信息,通過 “節”或 “段” 存儲。
分段的原因:

  • 數據和指令映射到兩個虛存空間,這兩個空間的許可權不同,可以防止程式指令被改寫。
  • 現代CPU緩存一般被設計成數據緩存和指令緩存分離,分段有利於提高程式的局部性。
  • 程式中如果運行著許多副本,記憶體中只需要保存一份程式的指令部分。

主要分為兩種段,代碼段(.text)和數據段(.data,.bss)

名稱 存儲內容
局部變數、函數參數、返回地址
動態分配記憶體
BSS段 未初始化或者初始值為0的全局變數或者局部靜態變數
數據段(.test) 已初始化且初始化值不為0的全局變數或者局部靜態變數
代碼段 (.data) 可執行代碼、字元串字面值、只讀變數

示例代碼

#include<stdio.h>
int data1;		//.bss
int data2 = 0;		//.bss
int data3 = 10;		//.data

static int data4;		//.bss
static int data5 = 0;	//.bss
static int data6 = 20;		//.data

int main()			//.text
{
    int a;			//.text
    int b = 0;			//.text
    int c = 10;			//.text

    static int data7;		//.bss
    static int data8 = 0;	//.bss
    static int data9 = 40;	//.data

    return 0;
}

image

四、深入 .o文件

編譯:gcc -c main.c
查看文件解構:objdump -h main.o

image
Size:段的長度
File off:段的位置
image

4.1 代碼段

objdump -s -d main.o

image

4.2 數據段

objdump -x -s -d main.o

可以清楚的發現,.data段中的前4個位元組,從低到高為"0x0a 0x00 0x00 0x00 "這個值剛好是data3的值,10進位的10。
image

4.3 BSS段

objdump -x -s -d main.o

image
在之前的段表之中發現,.bss和.comment段的起始地址都是一樣的。有些編譯器會將全局的未初始化的變數放在.bss中,有些只是預留一個未定義的全局變數符號,等到鏈接的時候再在.bss段中分配空間。
可以在段表中發現,一些變數並未在.bss段中。
image

4.4 其他段

image

問題:將一個二進位文件作為目標文件的一個段?
image

4.5 自定義段

//變數:
__attribute__((section("FUN"))) int x = 10;
//函數:
__attribute__((section("BAR"))) void fun()
{

}

五、ELF文件

ELF目標文件格式:
image

  • ELF文件頭:包含著整個文件的基本屬性,ELF文件版本、目標機器型號、程式入口地址。
  • 各個段
  • 段表:所有段的基本信息,段名、長度、偏移量、讀寫許可權等
  • 字元表和符號表
    ...

5.1 文件頭

查看文件頭:readlef -h main.o 

文件頭格式:

image

魔數:
文件頭的結構和相關常數被定義在“/usr/include/elf.h”中,ELF文件有32為版本和64位版本,區別僅僅是成員大小不一樣。
image

文件類型:
e_type類型表示ELF的文件類型,通常以ET_開頭
image

機器類型:
e_machine
通常以EM_開頭
image

"elf.h"定義了自己的類型:
image

通過Elf32_Ehdr觀察文件頭的結構和之前有些相似:
image

將ELF文件頭結構與之前輸出的一一對應:
image

5.2 段表

readelf -S main.o

顯示ELF的主要段以及其他府逐段,如符號表、字元串表、段名字元串表、重定位表
image
段表的結構由"Elf32_Shdr"這個結構體數組保存,稱為段描述符。
ELF段表數組的第一個元素是無效的段描述符,類型是"NULL",也就是有效段的數量是顯示段-1。
image
這是其中每個段的含義
image

image

5.3 重定位表

鏈接器在處理目標文件的時候,需要對目標文件中某些部位進行重定位,即代碼段和數據段中隊絕對地址引用的位置。
重定位表的類型是"SHT_REL"。對於每一個需要重定位的代碼段和數據段,都會有一個重定位表。
如:.rel.text就是.text的重定位表,因為.text至少有一個絕對地址的引用,就是調用了printf函數。

5.4 字元串表

段名為:.strtab或者.shastrtab
用來保存普通字元串或者用來保存段表中用到的字元串。

六、強符號和弱符號

6.1 強符號和弱符號

強符號:編譯器預設函數和初始化的全局變數
弱符號:未初始化的全局變數
註意:強弱符號都是對定義來說的,不是針對符號的引用的

extern int ext;

int weak1;
int strong = 1;
__attribute__((weak)) weak2 = 2;

int main()
{
	return 0;
}

weak1 和 weak2 都是弱符號
strong 和 main 都是強符號
ext既不是強符號也不是弱符號,因為它是一個外部變數引用。

強弱符號也有如下規則:

  • 不允許被多次定義(目標文件中不允許有同名的強符號)
  • 一個符號在某目標文件中是強符號,在另一個文件中是弱符號,那麼選擇強符號
  • 一個符號在目標文件中都是弱符號,那麼選擇占用空間最大的那一個。

6.2 弱引用和強引用

強引用沒有找到符號的定義,鏈接器就會符號未定義的誤。

弱引用

  • 如果沒有定義,則鏈接器不報錯
  • 如果該符號有定義,則鏈接器將該符號的引用決議
  • 對於未定義的弱引用,鏈接器不認為它是一個錯誤,一般未定義的弱引用,鏈接器預設是0,或者是一個特殊的值,以便程式代碼能夠識別。
__attribute__((weakref))void fun();

int main()
{
	fun();
	return 0;
}

使用__attribute__((weakref))聲明為弱引用。
鏈接時並不會報錯,但是執行時會報錯。
因為fun函的地址為0,發生了訪址錯誤。

總結

什麼是目標文件,4種目標文件,Linux中的目標文件

ELF:

  • 文件頭
  • 段表
  • 重定位表
  • 字元串表
  • 符號表
  • 調試表

強符號和弱符號
強引用和弱引用


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • JavaScript 中的記憶體管理主要由 JavaScript 引擎負責,開發人員不需要手動管理記憶體。JavaScript 引擎使用垃圾回收演算法來實現自動垃圾回收。 JavaScript 垃圾回收演算法是指在 JavaScript 程式中,用來回收不再使用的記憶體的演算法。 ...
  • 使用 CSS 的 box-sizing 屬性 MDN docs 關於box-sizing 一種解決方法是使用 CSS 的 box-sizing 屬性來控制元素的盒模型。預設情況下,盒模型是 "content-box",這意味著元素的寬度和高度只包括其內容,而不包括 padding 和 border。 ...
  • 最近寫了個 python 的 tkinter 框架入門教程,希望給大家介紹一下這個框架的上手過程,這是一個系列文章,現在是第一篇。 ...
  • 2023-01-22 一、SSM整合 1、Spring + SpringMVC (1)容器管理對象,由DispatcherServlet管理 (2)Spring容器對象,由ContextLoaderListener管理 2、解決組件掃描的衝突問題 (1)SpringMVC只掃描Controller層 ...
  • 這篇筆記咱日後應該還會進行補充。 關於sort的比較函數 STL的algorithm庫中的sort函數,可以接受一個cmp函數作為第三個參數,用來指定排序的規則。 自定義sort比較函數 cmp(a,b)函數的返回值是一個bool值,當返回值為true時不改變元素順序。 可以把其中的a看作序列中前一 ...
  • 2023-01-22 一、SpringMVC攔截器的兩種裝配方式 1、全局裝配(放置在springmvc.xml中) <!-- 裝配攔截器--> <!-- 全局裝配--> <mvc:interceptors> <ref bean="myInterceptor"></ref> </mvc:interc ...
  • 題目描述 牛牛從鍵盤上輸入三個整數,並嘗試在屏幕上顯示第二個整數。 輸入描述 一行輸入 3 個整數,用空格隔開。 輸出描述 請輸出第二個整數的值。 示例 1 輸入:1 2 3 輸出:2 解題思路 方案一 使用 3 個整形變數依次存儲輸入的 3 個整數,然後將第二個整形變數的數據輸出。 具體代碼如下: ...
  • 是否有小伙伴在使用tab的時候想進行滑動切換Tab? 並且有滑動左出左進,右出右進的效果 ,本文將講解怎麼在Blazor中去通過滑動切換Tab 本文中的UI組件使用的是MASA Blazor,您也可以是其他的UI框架,這個並不影響實際的運行效果,本文案例是相容PC和Android的,演示效果是and ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...