]> git.sesse.net Git - bcachefs-tools-debian/blob - linux/bio.c
New upstream snapshot
[bcachefs-tools-debian] / linux / bio.c
1 /*
2  * Copyright (C) 2001 Jens Axboe <axboe@kernel.dk>
3  *
4  * This program is free software; you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License version 2 as
6  * published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it will be useful,
9  * but WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11  * GNU General Public License for more details.
12  *
13  * You should have received a copy of the GNU General Public Licens
14  * along with this program; if not, write to the Free Software
15  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-
16  *
17  */
18 #include <linux/bio.h>
19 #include <linux/blkdev.h>
20 #include <linux/slab.h>
21 #include <linux/kernel.h>
22
23 static const struct {
24         int             err;
25         const char      *name;
26 } blk_errors[] = {
27         [BLK_STS_OK]            = { 0,          "" },
28         [BLK_STS_NOTSUPP]       = { -EOPNOTSUPP, "operation not supported" },
29         [BLK_STS_TIMEOUT]       = { -ETIMEDOUT, "timeout" },
30         [BLK_STS_NOSPC]         = { -ENOSPC,    "critical space allocation" },
31         [BLK_STS_TRANSPORT]     = { -ENOLINK,   "recoverable transport" },
32         [BLK_STS_TARGET]        = { -EREMOTEIO, "critical target" },
33         [BLK_STS_NEXUS]         = { -EBADE,     "critical nexus" },
34         [BLK_STS_MEDIUM]        = { -ENODATA,   "critical medium" },
35         [BLK_STS_PROTECTION]    = { -EILSEQ,    "protection" },
36         [BLK_STS_RESOURCE]      = { -ENOMEM,    "kernel resource" },
37         [BLK_STS_AGAIN]         = { -EAGAIN,    "nonblocking retry" },
38
39         /* device mapper special case, should not leak out: */
40         [BLK_STS_DM_REQUEUE]    = { -EREMCHG, "dm internal retry" },
41
42         /* everything else not covered above: */
43         [BLK_STS_IOERR]         = { -EIO,       "I/O" },
44 };
45
46 int blk_status_to_errno(blk_status_t status)
47 {
48         int idx = (__force int)status;
49
50         if (WARN_ON_ONCE(idx >= ARRAY_SIZE(blk_errors)))
51                 return -EIO;
52         return blk_errors[idx].err;
53 }
54
55 const char *blk_status_to_str(blk_status_t status)
56 {
57         int idx = (__force int)status;
58
59         if (WARN_ON_ONCE(idx >= ARRAY_SIZE(blk_errors)))
60                 return "(invalid error)";
61         return blk_errors[idx].name;
62 }
63
64 void bio_copy_data_iter(struct bio *dst, struct bvec_iter *dst_iter,
65                         struct bio *src, struct bvec_iter *src_iter)
66 {
67         struct bio_vec src_bv, dst_bv;
68         void *src_p, *dst_p;
69         unsigned bytes;
70
71         while (src_iter->bi_size && dst_iter->bi_size) {
72                 src_bv = bio_iter_iovec(src, *src_iter);
73                 dst_bv = bio_iter_iovec(dst, *dst_iter);
74
75                 bytes = min(src_bv.bv_len, dst_bv.bv_len);
76
77                 src_p = kmap_atomic(src_bv.bv_page);
78                 dst_p = kmap_atomic(dst_bv.bv_page);
79
80                 memcpy(dst_p + dst_bv.bv_offset,
81                        src_p + src_bv.bv_offset,
82                        bytes);
83
84                 kunmap_atomic(dst_p);
85                 kunmap_atomic(src_p);
86
87                 flush_dcache_page(dst_bv.bv_page);
88
89                 bio_advance_iter(src, src_iter, bytes);
90                 bio_advance_iter(dst, dst_iter, bytes);
91         }
92 }
93
94 /**
95  * bio_copy_data - copy contents of data buffers from one bio to another
96  * @src: source bio
97  * @dst: destination bio
98  *
99  * Stops when it reaches the end of either @src or @dst - that is, copies
100  * min(src->bi_size, dst->bi_size) bytes (or the equivalent for lists of bios).
101  */
102 void bio_copy_data(struct bio *dst, struct bio *src)
103 {
104         struct bvec_iter src_iter = src->bi_iter;
105         struct bvec_iter dst_iter = dst->bi_iter;
106
107         bio_copy_data_iter(dst, &dst_iter, src, &src_iter);
108 }
109
110 void zero_fill_bio_iter(struct bio *bio, struct bvec_iter start)
111 {
112         unsigned long flags;
113         struct bio_vec bv;
114         struct bvec_iter iter;
115
116         __bio_for_each_segment(bv, bio, iter, start) {
117                 char *data = bvec_kmap_irq(&bv, &flags);
118                 memset(data, 0, bv.bv_len);
119                 bvec_kunmap_irq(data, &flags);
120         }
121 }
122
123 void __bio_clone_fast(struct bio *bio, struct bio *bio_src)
124 {
125         /*
126          * most users will be overriding ->bi_bdev with a new target,
127          * so we don't set nor calculate new physical/hw segment counts here
128          */
129         bio->bi_bdev = bio_src->bi_bdev;
130         bio_set_flag(bio, BIO_CLONED);
131         bio->bi_opf = bio_src->bi_opf;
132         bio->bi_iter = bio_src->bi_iter;
133         bio->bi_io_vec = bio_src->bi_io_vec;
134 }
135
136 struct bio *bio_clone_fast(struct bio *bio, gfp_t gfp_mask, struct bio_set *bs)
137 {
138         struct bio *b;
139
140         b = bio_alloc_bioset(gfp_mask, 0, bs);
141         if (!b)
142                 return NULL;
143
144         __bio_clone_fast(b, bio);
145         return b;
146 }
147
148 struct bio *bio_split(struct bio *bio, int sectors,
149                       gfp_t gfp, struct bio_set *bs)
150 {
151         struct bio *split = NULL;
152
153         BUG_ON(sectors <= 0);
154         BUG_ON(sectors >= bio_sectors(bio));
155
156         /*
157          * Discards need a mutable bio_vec to accommodate the payload
158          * required by the DSM TRIM and UNMAP commands.
159          */
160         if (bio_op(bio) == REQ_OP_DISCARD || bio_op(bio) == REQ_OP_SECURE_ERASE)
161                 split = bio_clone_bioset(bio, gfp, bs);
162         else
163                 split = bio_clone_fast(bio, gfp, bs);
164
165         if (!split)
166                 return NULL;
167
168         split->bi_iter.bi_size = sectors << 9;
169
170         bio_advance(bio, split->bi_iter.bi_size);
171
172         return split;
173 }
174
175 void bio_free_pages(struct bio *bio)
176 {
177         struct bvec_iter_all iter;
178         struct bio_vec *bvec;
179
180         bio_for_each_segment_all(bvec, bio, iter)
181                 __free_page(bvec->bv_page);
182 }
183
184 void bio_advance(struct bio *bio, unsigned bytes)
185 {
186         bio_advance_iter(bio, &bio->bi_iter, bytes);
187 }
188
189 static void bio_free(struct bio *bio)
190 {
191         unsigned front_pad = bio->bi_pool ? bio->bi_pool->front_pad : 0;
192
193         kfree((void *) bio - front_pad);
194 }
195
196 void bio_put(struct bio *bio)
197 {
198         if (!bio_flagged(bio, BIO_REFFED))
199                 bio_free(bio);
200         else {
201                 BUG_ON(!atomic_read(&bio->__bi_cnt));
202
203                 /*
204                  * last put frees it
205                  */
206                 if (atomic_dec_and_test(&bio->__bi_cnt))
207                         bio_free(bio);
208         }
209 }
210
211 int bio_add_page(struct bio *bio, struct page *page,
212                  unsigned int len, unsigned int off)
213 {
214         struct bio_vec *bv = &bio->bi_io_vec[bio->bi_vcnt];
215
216         WARN_ON_ONCE(bio_flagged(bio, BIO_CLONED));
217         WARN_ON_ONCE(bio->bi_vcnt >= bio->bi_max_vecs);
218
219         bv->bv_page = page;
220         bv->bv_offset = off;
221         bv->bv_len = len;
222
223         bio->bi_iter.bi_size += len;
224         bio->bi_vcnt++;
225         return len;
226 }
227
228 static inline bool bio_remaining_done(struct bio *bio)
229 {
230         /*
231          * If we're not chaining, then ->__bi_remaining is always 1 and
232          * we always end io on the first invocation.
233          */
234         if (!bio_flagged(bio, BIO_CHAIN))
235                 return true;
236
237         BUG_ON(atomic_read(&bio->__bi_remaining) <= 0);
238
239         if (atomic_dec_and_test(&bio->__bi_remaining)) {
240                 bio_clear_flag(bio, BIO_CHAIN);
241                 return true;
242         }
243
244         return false;
245 }
246
247 static struct bio *__bio_chain_endio(struct bio *bio)
248 {
249         struct bio *parent = bio->bi_private;
250
251         if (!parent->bi_status)
252                 parent->bi_status = bio->bi_status;
253         bio_put(bio);
254         return parent;
255 }
256
257 static void bio_chain_endio(struct bio *bio)
258 {
259         bio_endio(__bio_chain_endio(bio));
260 }
261
262 void bio_endio(struct bio *bio)
263 {
264 again:
265         if (!bio_remaining_done(bio))
266                 return;
267
268         /*
269          * Need to have a real endio function for chained bios, otherwise
270          * various corner cases will break (like stacking block devices that
271          * save/restore bi_end_io) - however, we want to avoid unbounded
272          * recursion and blowing the stack. Tail call optimization would
273          * handle this, but compiling with frame pointers also disables
274          * gcc's sibling call optimization.
275          */
276         if (bio->bi_end_io == bio_chain_endio) {
277                 bio = __bio_chain_endio(bio);
278                 goto again;
279         }
280
281         if (bio->bi_end_io)
282                 bio->bi_end_io(bio);
283 }
284
285 void bio_reset(struct bio *bio)
286 {
287         unsigned long flags = bio->bi_flags & (~0UL << BIO_RESET_BITS);
288
289         memset(bio, 0, BIO_RESET_BYTES);
290         bio->bi_flags = flags;
291         atomic_set(&bio->__bi_remaining, 1);
292 }
293
294 struct bio *bio_alloc_bioset(gfp_t gfp_mask, int nr_iovecs, struct bio_set *bs)
295 {
296         unsigned front_pad = bs ? bs->front_pad : 0;
297         struct bio *bio;
298         void *p;
299
300         p = kmalloc(front_pad +
301                     sizeof(struct bio) +
302                     nr_iovecs * sizeof(struct bio_vec),
303                     gfp_mask);
304
305         if (unlikely(!p))
306                 return NULL;
307
308         bio = p + front_pad;
309         bio_init(bio, bio->bi_inline_vecs, nr_iovecs);
310         bio->bi_pool = bs;
311
312         return bio;
313 }
314
315 struct bio *bio_clone_bioset(struct bio *bio_src, gfp_t gfp_mask,
316                              struct bio_set *bs)
317 {
318         struct bvec_iter iter;
319         struct bio_vec bv;
320         struct bio *bio;
321
322         bio = bio_alloc_bioset(gfp_mask, bio_segments(bio_src), bs);
323         if (!bio)
324                 return NULL;
325
326         bio->bi_bdev            = bio_src->bi_bdev;
327         bio->bi_opf             = bio_src->bi_opf;
328         bio->bi_iter.bi_sector  = bio_src->bi_iter.bi_sector;
329         bio->bi_iter.bi_size    = bio_src->bi_iter.bi_size;
330
331         switch (bio_op(bio)) {
332         case REQ_OP_DISCARD:
333         case REQ_OP_SECURE_ERASE:
334                 break;
335         case REQ_OP_WRITE_SAME:
336                 bio->bi_io_vec[bio->bi_vcnt++] = bio_src->bi_io_vec[0];
337                 break;
338         default:
339                 bio_for_each_segment(bv, bio_src, iter)
340                         bio->bi_io_vec[bio->bi_vcnt++] = bv;
341                 break;
342         }
343
344         return bio;
345 }